導航:首頁 > 編程語言 > 軟體使用統計python

軟體使用統計python

發布時間:2023-02-04 23:45:18

1. R 和 python 用於統計學分析,哪個更好

總的概括:R主要在學術界流行,python(numpy scipy)在工程方便比較實用。

R是S(Splus)的開源版本,或者下一代。發源地在紐西蘭奧克蘭。這個軟體的統計背景很濃烈。我這里濃烈的意思是,如果你不熟習統計知識(歷史)的話,R的幫助文檔看起來是很累的。由統計背景的人開發。R的維護組叫CRAN-R。在生物信息方便,有個叫bioconctor的組織,裡面有很多生物信息方面可以用的軟體包,他們有一套自己維護package系統。

Python是個綜合語言(這里特指指CPython解釋器),numpy scipy是數值計算的擴展包,pandas是主要用來做數據處理(numpy依賴),sympy做符號計算(類似mathematica?)此外還有一些不太成熟的包如sciki learn,statistical models。成熟度不如R。但是已經到了可用的水平了。是讀計算機的人寫的統計包。ipython 更新到1.0以後,功能基本完善,其notebook非常強大(感覺就像mathematica)而且還是基於web,在合作分享方面非常好用。

性能:
大家都說R慢,特別是CS的人。其實這里主要是兩點:一個R裡面數組的調用都是用復制的,二是Rscript慢。三是處理大數據慢。如果R用的好的話,R是不太慢的。具體來說就是Rscript用的少,多用命令,跑點小數據。這樣的話,實際在跑的都是背後的fortran和C庫。他們都有快二三十年歷史了。可謂異常可靠,優化得不能再優化了(指單線程,如果去看源代碼揮發先許多莫名的常數,永用了以後精度高速度快!)。比如一個自己編寫一個R腳本,loop套loop的那種,那真是想死的心都會有。外加一點,R處理文本文件很慢!

Python歸根揭底還是個有解釋器的腳本語言,而且有致命傷——GIL,但python最難能可貴的就是它很容易變得更快。比如pypy,cython,或者直接ctypes掛C庫。純python寫個原型,然後就開是不斷的profiling和加速吧。很輕易可以達到和C一個數量級的速度,但是寫程序、調試的時間少了很多。

並行計算:
R v15 之後有了自帶的parallel包,用挺輕松的。不過其實就是不停的fork,或者mpi,內存消耗挺厲害的。parSapply,parApply什麼的,真是很好用。

Python雖然有GIL——並行計算的死敵,但是有multiprocessing(fork依賴) ,是可以共享數據的什麼的,估計內存消耗方面比R好點,數據零散的話overhead很多。到了MPI的話,mpi4py還是挺好用的。用cython的話結合openmp可以打破GIL,但是過程中不能調用python的對象。

學習曲線:假設什麼編程都不會的同學。
R一開始還是很容易上手的,查到基本的命令,包,直接print一下就有結果了。但是如果要自己寫演算法、優化性能的時候,學習難度陡增。

Python么,挺好學的,絕大多數的幫助文檔都比R好了許多。有些包用起來沒R方便。總的來說深入吼R陡。

擴展資源:
基本上新的統計方法都會有R的package,安裝實用都不麻煩。但是基本上都是搞統計的人寫的計算機包。所以效能上可能有問好。比較出名的有兩個包的管理網站,cran-r 和bioconctor。 所以搞生化的估計R用起來很方便。

python的統計計算包們比R少,多很年輕,還在不斷的開發中。優於是計算機人寫的統計包,用起來的時候要多漲個心眼。

畫圖:
R自帶的那些工具就挺好用了,然後還有ggplot這種非常優美的得力工具。

python 有matplotlib,畫出來效果感覺比R自帶的好一些些,而且界面基於QT,跨平台支持。可能是R用得多了,pyplot用起來還是不太順手,覺得其各個組建的統一性不高。

IDE:
Rstudio非常不錯,提供類matlab環境。(用過vim-r-plugin,用過emacs + ess現在用vim。)

windows 下有python(x,y) 還有許多商業的工具。(本人現在的emacs環境還不是很順手~)

建議:
如果只是處理(小)數據的,用R。結果更可靠,速度可以接受,上手方便,多有現成的命令、程序可以用。

要自己搞個演算法、處理大數據、計算量大的,用python。開發效率高,一切盡在掌握。

ps:盲目地用R的包比盲目的地用python的包要更安全。起碼R會把你指向一篇論文,而python只是指向一堆代碼。R出問題了還有論文作者、審稿人陪葬。

2. 如何利用python進行數據分析

近年來分析學在數據、網路、金融等領域獲得了突出的地位。應用各種軟體組合起來進行數據收集,數據管理,以及數據分析,得出的結論用作商業決策,業務需求分析等等。分析學用於研究一個產品的市場效應,銀行的貸款決定,這些都只是分析學的冰山一角。它在大數據,安全,數字和軟體分析等領域有很深遠的影響,下面是Python在分析學中的主要作用的一個延續:
在這個信息過載的世界,只有那些可以利用解析數據的優勢來得出見解的人會獲益。Python對於大數據的解釋和分析具有很重要的作用。分析公司開發的很多工具都是基於Python來約束大數據塊。分析師們會發現Python並不難學,它是一個強有力的數據管理和業務支持的媒介。
使用單一的語言來處理數據有它的好處。如果你以前曾經使用過C++或者Java,那麼對你來說,Python應該很簡單。數據分析可以使用Python實現,有足夠的Python庫來支持數據分析。 Pandas是一個很好的數據分析工具,因為它的工具和結構很容易被用戶掌握。對於大數據來說它無疑是一個最合適的選擇。即使是在數據科學領域,Python也因為它的「開發人員友好性」而使其他語言相形見絀。一個數據科學家熟悉Python的可能性要比熟悉其他語言的可能性高得多。
除了Python在數據分析中那些很明顯的優點(易學,大量的在線社區等等)之外,在數據科學中的廣泛使用,以及我們今天看到的大多數基於網路的分析,是Python在數據分析領域得以廣泛傳播的主要原因。
不論是金融衍生品還時大數據分析,Python都發揮了重要的作用。就前者而言,Python能夠很好地和其它系統,軟體工具以及數據流結合在一起,當然也包括R。用Python來對大數據做圖表效果更好,它在速度和幫助方面也一樣可靠。有些公司使用Python進行預測分析和統計分析。

3. 使用Python做數據分析的優點是什麼

最近幾年,大數據的發展程度越來越明顯,很多企業由於使用了大數據分析使得企業朝著更好的方向發展,這就導致的數據分析行業的人才開始稀缺起來,對於數據分析這個工作中,是需要學會一些編程語言的,比如MATLAB,Python,Java等語言。對於初學者來說,Python是一個不錯的語言,Python語言簡單易懂,同時對於大數據分析有很明顯的幫助。那麼使用Python做數據分析的優點是什麼呢?一般來說就是簡單易學、語言通用、存在科學計算活躍區域等等。

首先說說Python的第一個優點,那就是簡單易學。很多學過Java的朋友都知道,Python語法簡單的多,代碼十分容易被讀寫,最適合剛剛入門的朋友去學習。我們在處理數據的時候,一般都希望數據能夠轉化成可運算的數字形式,這樣,不管是沒學過編程的人還是學過編程的人都能夠看懂這個數據。

Python在數據分析和交互、探索性計算以及數據可視化等方面都顯得比較活躍,這就是Python作為數據分析的原因之一,python擁有numpy、matplotlib、scikit-learn、pandas、ipython等工具在科學計算方面十分有優勢,尤其是pandas,在處理中型數據方面可以說有著無與倫比的優勢,已經成為數據分析中流砥柱的分析工具。

Python也具有強大的編程能力,這種編程語言不同於R或者matlab,python有些非常強大的數據分析能力,並且還可以利用Python進行爬蟲,寫游戲,以及自動化運維,在這些領域中有著很廣泛的應用,這些優點就使得一種技術去解決所有的業務服務問題,這就充分的體現的Python有利於各個業務之間的融合。如果使用Python,能夠大大的提高數據分析的效率。

python是人工智慧時代的通用語言

Python對於如今火熱的人工智慧也有一定的幫助,這是因為人工智慧需要的是即時性,而Python是一種非常簡潔的語言,同時有著豐富的資料庫以及活躍的社區,這樣就能夠輕松的提取數據,從而為人工智慧做出優質的服務。
通過上面的描述,想必大家已經知道了使用Python做數據分析的優點是什麼了吧,Python語言得益於它的簡單方便使得在大數據、數據分析以及人工智慧方面都有十分明顯的存在感,對於數據分析從業者以及想要進入數據分析從業者的人來說,簡單易學容易上手的優勢也是一個優勢,所以,要做好數據分析,一定要學會Python語言。

4. arcgis 怎麼用python做統計分析

方法/步驟

1
打開arcmap軟體,點擊工具欄上的ArcToolbox工具箱,在工具箱裡面選擇要進行數據處理的工具(工具的選擇視數據處理的內容而定),本文選擇了「Define Projection」定義投影的工具進行說明。
雙擊此工具,在彈出的工具窗口點擊右下角的「Show Help>>」按鈕。

2
點擊「Tool Help」按鈕,此時就打開了軟體的幫助文檔並定位到了此工具(define projection)對應的頁面,往下拉動滾動條,定位到此工具的python腳本的內容:
Syntax 介紹了此工具腳本的語法
Code Sample 介紹了腳本使用的例子
拷貝腳本使用例子裡面的代碼。

3
在軟體的主界面點擊「Geoprocessing」菜單-->點擊「Python」菜單項,即出現內嵌在arcigis中的python工具窗口。
python工具窗口的左邊是代碼編輯區域,右邊是信息提示區域。

4
把第2步拷貝的代碼語句粘貼到python工具窗口的左邊區域,修改一下工具腳本的參數(視具體工具和數據而定),連續點擊兩下回車鍵。

5
等待腳本程序的執行完成,完成之後在桌面右下角會彈出提示信息,同時pythong工具窗口的右邊區域也會有具體的工具腳本執行信息。

6
執行完成之後,在arcmap載入處理過的數據,右鍵查看屬性,可以看到通過此工具腳本(define projection)進行投影定義的數據已經具有了投影參數。

http://jingyan..com/article/eae07827ba96a51fec548513.html

5. 請問python主要應用領域是什麼,哪方面用的多了....

Web開發:最火的Python Web框架Django,支持非同步高並發的Tornado框架,短小精悍的flask,bootle,Django官方的標語把Django定義為the framework for perfectionist with deadlines(大意是一個為完全主義者開發的高效率Web框架)。
網路編程:支持高並發的Twisted網路框架,py3引入的asyncio使非同步編程變得非常簡單。
爬蟲:在爬蟲領域,Python幾乎是霸主地位,Scrapy、Request、BeautifuSoap、urllib等,想爬什麼爬什麼。
雲計算:目前最火的知名的雲計算框架是OpenStack,Python現在的火爆,很大一部分就是因為雲計算。
人工智慧/數據分析:Python是目前公認的人工智慧和數據分析領域的首選語言。
自動化運維:問問中國運維人員,運維人員必須會什麼語言?十分之九的人會回答Python。
不僅這些,Python還可以做的事情有很多,比如金融分析,Python是金融分析、量化交易領域使用最多的編程語言;科學計算,Python越來越適用於科學計算、繪制高質量的2D和3D圖像。
此外,現在很多公司都在使用Python,比如谷歌,Google APP Engine、Google earth、谷歌爬蟲等,都在大量使用Python開發;NASA,大量使用Python進行數據分析和運算;YouTube,世界上最大的視頻網站YouTube就是用Python開發的;Redhat,世界上最流行的Linux發行版本中的yum包管理工具就是用Python開發的。遠不止這些,還有國內的豆瓣、知乎、春雨醫生、騰訊、搜狐、網路、阿里等公司都在使用Python完成各種任務。

6. 你好 想用Python做一個英文單詞詞頻統計軟體,將當前目錄下的所有txt文檔讀進去,然後生成一個excel文檔

#!/usr/bin/env python
dic={}
for i in open('data.txt'):
array=[]
i=i.strip()
array=i.split()
for j in array:
if not dic.has_key(j):
dic[j]=0
dic[j]+=1

for i in dic.keys():
print i,dic[i]

閱讀全文

與軟體使用統計python相關的資料

熱點內容
設備樹編譯vendor 瀏覽:369
app神州租車怎麼退訂單 瀏覽:864
幽默程序員的作文 瀏覽:287
linuxbenchmark 瀏覽:895
高分子pdf 瀏覽:689
加密電池測電流 瀏覽:894
電腦怎麼下載appstore 瀏覽:725
兩台電腦使用代理伺服器怎麼連接 瀏覽:231
初創公司買什麼配置的雲伺服器 瀏覽:165
程序員的實力測試 瀏覽:509
手機版寶可夢模組的伺服器怎麼進 瀏覽:119
qt在arm上編譯過程 瀏覽:124
黑白命令在哪裡 瀏覽:22
演算法崗問面試官的問題 瀏覽:117
720pjpg壓縮 瀏覽:525
經濟學人app怎麼用 瀏覽:734
thunderbird如何刪除伺服器 瀏覽:632
編譯內核模塊准備工作 瀏覽:187
protues單片機 瀏覽:680
淘寶想多開店怎麼租伺服器 瀏覽:581