① 數據分析用python還是r語言
數據分析的話,我覺得都是可以採用的,因為兩者來說都是有一些特點有優勢也有劣勢
② 學習量化選擇Python還是R比較好
對於想從事數據行業的人和數據工作者來說,是學習R還是 python,哪個工具更實用一直被大家爭論。python 和R是統計學中兩種最流行的的編程語言,R的功能性主要是統計學家在開發時考慮的(R具有強大的可視化功能),而 Python 因為易於理解的語法被大家所接受。
在這篇文章中,我們將重點介紹R和 Python 以及它們在數據科學和統計上地位之間的差異。
關於R的介紹
Ross Ihaka 和 Robert Gentleman 於 1995 年在S語言中創造了開源語言R,目的是專注於提供更好和更人性化的方式做數據分析、統計和圖形模型的語言。
起初R主要是在學術和研究使用,但近來企業界發現R也很不錯。這使得中的R成為企業中使用的全球發展最快的統計語言之一。
R 的主要優勢是它有一個龐大的社區,通過郵件列表,用戶貢獻的文檔和一個非常活躍的堆棧溢出組提供支持。還有 CRAN 鏡像,一個用戶可以很簡單地創造的一個包含R包的知識庫。這些包有R裡面的函數和數據,各地的鏡像都是R網站的備份文件,完全一樣,用戶可以可以選擇離你最近的鏡像訪問最新的技術和功能,而無需從頭開發。
如果你是一個有經驗的程序員,你可以不會覺得使用R可以提高效率,但是,你可能會發現學習R經常會遇到瓶頸。幸運的是現在的資源很多。
關於 Python 的介紹
Python 是由 Guido van Rossem 創建於 1991 年,並強調效率和代碼的可讀性。希望深入的數據分析或應用統計技術的程序員是 Python 的主要用戶。
當你越需要在工程環境中工作,你會越喜歡 Python。它是一種靈活的語言,在處理一些新東西上表現很好,並且注重可讀性和簡單性,它的學習曲線是比較低的。
和R類似,Python 也有包,pypi 是一個 Python 包的倉庫,裡面有很多別人寫好的 Python 庫。
Python 也是一個大社區,但它是一個有點比較分散,因為它是一個通用的語言。然而,Python 自稱他們在數據科學中更占優勢地位:預期的增長,更新穎的科學數據應用的起源在這里。
R和 Python:數字的比較
在網上可以經常看到比較R和 Python 人氣的數字,雖然這些數字往往就這兩種語言是如何在計算機科學的整體生態系統不斷發展,但是很難並列進行比較。主要的原因是,R僅在數據科學的環境中使用,而 Python 作為一種通用語言,被廣泛應用於許多領域,如網路的發展。這往往導致排名結果偏向於 Python,而且從業者工資會較低。
R如何使用?
R 主要用於當數據分析任務需要獨立的計算或分析單個伺服器。這是探索性的工作,因為R有很多包和隨時可用的測試,可以提供提供必要的工具,快速啟動和運行的數量龐大幾乎任何類型的數據分析。R甚至可以是一個大數據解決方案的一部分。
當開始使用R的時候,最好首先安裝 RStudio IDE。之後建議你看看下面的流行包:
Python 如何使用?
如果你的數據分析任務需要使用 Web 應用程序,或代碼的統計數據需要被納入生產資料庫進行集成時你可以使用 python,作為一個完全成熟的編程語言,它是實現演算法一個偉大的工具。
雖然在過去 python 包對於數據分析還處於早期階段,但是這些年已經有了顯著改善。使用時需要安裝 NumPy/ SciPy 的(科學計算)和 pandas(數據處理),以使 Python 可用於數據分析。也看看 matplotlib,使圖形和 scikit-learn 機器學習。
不同於R,Python 有沒有明確的非常好的 IDE。我們建議你看看 Spyder 以及 IPython 網站,看看哪一個最適合你。
R和 Python:數據科學行業的表現
如果你看一下最近的民意調查,在數據分析的編程語言方面,R是明顯的贏家。
有越來越多的人從研發轉向 Python。此外,有越來越多的公司使用這兩種語言來進行組合。
如果你打算從事數據行業,你用好學會這兩種語言。招聘趨勢顯示這兩個技能的需求日益增加,而工資遠高於平均水平。
R:優點和缺點
優點
可視化能力強
可視化通常讓我們更有效地理解數字本身。R和可視化是絕配。一些必看的可視化軟體包是 ggplot2,ggvis,googleVis 和 rCharts。
完善的生態系統
R 具有活躍的社區和一個豐富的生態系統。R包在 CRAN,Bioconctor 的和 Github 上。您可以通過 Rdocumentation 搜索所有的R包。
用於數據科學
R 由統計學家開發,他們可以通過R代碼和包交流想法和概念,你不一定需要有計算機背景。此外企業界也越來越接受R。
缺點
R比較緩慢
R 使統計人員的更輕松,但你電腦的運行速度可能很慢。雖然R的體驗是緩慢的,但是有多個包來提高的r性能:pqR,renjin,FastR, Riposte 等等。
R不容易深入學習
R 學習起來並不容易,特別是如果你要從 GUI 來進行統計分析。如果你不熟悉它,即使發現包可能會非常耗時。
Python:優點和缺點
優點
IPython Notebook
IPython Notebook 使我們更容易使用 Python 進行數據工作,你可以輕松地與同事共享 Notebook,而無需他們安裝任何東西。這大大減少了組織代碼,輸出和注釋文件的開銷。可以花更多的時間做實際的工作。
通用語言
Python 是一種通用的語言,容易和直觀。在學習上會比較容易,它可以加快你寫一個程序的速度。此外,Python 測試框架是一個內置的,這樣可以保證你的代碼是可重復使用和可靠的。
一個多用途的語言
Python 把不同背景的人集合在一起。作為一種常見的、容易理解,大部分程序員都懂的,可以很容易地和統計學家溝通,你可以使用一個簡單的工具就把你每一個工作夥伴都整合起來。
缺點
可視化
可視化是選擇數據分析軟體的一個重要的標准。雖然 Python 有一些不錯的可視化庫,如 Seaborn,Bokeh 和 Pygal。但相比於R,呈現的結果並不總是那麼順眼。
Python 是挑戰者
Python 對於R來說是一個挑戰者,它不提供必不可少的R包。雖然它在追趕,但是還不夠。
最終你該學習什麼呢:
由你決定!作為一個數據工作者,你需要在工作中選擇最適合需要的語言。在學習之前問清楚這些問題可以幫助你:
你想解決什麼問題?
什麼是學習語言的凈成本?
是什麼在你的領域中常用的工具?
什麼是其他可用工具以及如何做這些涉及到的常用工具?
③ 金融數據分析用python還是R還是matlab好
以前有過類似的問題 可以參考下:
http://www.xkyn.com/jiankang/tixing-2076112720581378468.htm
④ 數據分析一般用python還是R還是Java
企業日常數據分析:
1、如果是離線數據python會靈活一點(如設備的運維數據.), 但如果是實現數據還是用java會快一點(如ERP, MES.自動化.)
2、Java跑得更快,在WEKA上做數據分析會更「舒服」。
但python更加全面,適用性更廣。
3、做統計挖掘演算法分析的話用R,如果是其他用途建議學Python。適用范圍廣啊!
以上是幾種建議方法,各有各的特點!
⑤ 數據分析用r還是python
R和Python兩者誰更適合數據分析領域?在某些特定情況下誰會更有優勢?還是一個天生在各方面都比另一個更好?
當我們想要選擇一種編程語言進行數據分析時,相信大多數人都會想到R和Python——但是從這兩個非常強大、靈活的數據分析語言中二選一是非常困難的。
我承認我還沒能從這兩個數據科學家喜愛的語言中選出更好的那一個。因此,為了使事情變得有趣,本文將介紹一些關於這兩種語言的詳細信息,並將決策權留給讀者。值得一提的是,有多種途徑可以了解這兩種語言各自的優缺點。然而在我看來,這兩種語言之間其實有很強的關聯。
Stack Overflow趨勢對比
上圖顯示了自從2008年(Stack Overflow 成立)以來,這兩種語言隨著時間的推移而發生的變化。
R和Python在數據科學領域展開激烈競爭,我們來看看他們各自的平台份額,並將2016與2017年進行比較:
相關推薦:《Python入門教程》
接下來我們將從適用場景、數據處理能力、任務、安裝難度以及開放工具等方面詳細了解這兩種語言。
適用場景
R適用於數據分析任務需要獨立計算或單個伺服器的應用場景。Python作為一種粘合劑語言,在數據分析任務中需要與Web應用程序集成或者當一條統計代碼需要插入到生產資料庫中時,使用Python更好。
任務
在進行探索性統計分析時,R勝出。它非常適合初學者,統計模型僅需幾行代碼即可實現。Python作為一個完整而強大的編程語言,是部署用於生產使用的演算法的有力工具。
數據處理能力
有了大量針對專業程序員以及非專業程序員的軟體包和庫的支持,不管是執行統計測試還是創建機器學習模型,R語言都得心應手。
Python最初在數據分析方面不是特別擅長,但隨著NumPy、Pandas以及其他擴展庫的推出,它已經逐漸在數據分析領域獲得了廣泛的應用。
開發環境
對於R語言,需要使用R Studio。對於Python,有很多Python IDE可供選擇,其中Spyder和IPython Notebook是最受歡迎的。
熱門軟體包和庫
下面羅列了R和Python推出的針對專業以及非專業程序員的最熱門的軟體包和庫。
R:針對專業程序員的熱門軟體包
用於數據操作的 dplyr、plyr和 data table
用於字元串操作的 stringr
定期和不定期時間序列 zoo
數據可視化工具 ggvis、lattice 和 ggplot2
用於機器學習的 caret
R:針對非專業程序員的熱門軟體包
Rattle
R Commander
Decer
這些完整的GUI包可以實現強大的數據統計和建模功能。
Python:針對專業程序員的熱門庫
用於數據分析的 pandas
用於科學計算的 SciPy 和 NumPy
用於機器學習的 scikit-learn
圖表庫 matplotlib
statsmodels 用來探索數據,估算統計模型,並執行統計測試和單元測試
Python:針對非專業程序員的熱門庫
Orange Canvas 3.0是遵循GPL協議的開源軟體包。它使用一些常用的Python開源庫進行科學計算,包括numpy、scipy和scikit-learn。
R 和 Python 詳細對比
正如本文開頭提到的,R和Python之間有很強的關聯,並且這兩種語言日益普及。很難說哪一種更好,它們兩者的整合在數據科學界激起了許多積極和協作的波瀾。
總結
事實上,日常用戶和數據科學家可以同時利用這兩者語言,因為R用戶可以在R中通過 rPython包來運行R中的Python代碼,而Python用戶可以通過RPy2庫在Python環境中運行R代碼。
⑥ 做數據分析用R還是python好
R是統計分析的專用語言。Python是一門通用語言,應用領域更廣。如果專注數據分析,挖掘選用哪個差別不大,如果除了數據處理,還涉及到其他開發,則只能選Python了
⑦ python和r數據分析哪個更好
2012年的時候我們說R是學術界的主流,但是現在Python正在慢慢取代R在學術界的地位。不知道是不是因為大數據時代的到來。
Python與R相比速度要快。Python可以直接處理上G的數據;R不行,R分析數據時需要先通過資料庫把大數據轉化為小數據(通過groupby)才能交給R做分析,因此R不可能直接分析行為詳單,只能分析統計結果。所以有人說:Python=R+SQL/Hive,並不是沒有道理的。
Python的一個最明顯的優勢在於其膠水語言的特性,很多書里也都會提到這一點,一些底層用C寫的演算法封裝在Python包里後性能非常高效
(Python的數據挖掘包Orange canve
中的決策樹分析50萬用戶10秒出結果,用R幾個小時也出不來,8G內存全部占滿)。但是,凡事都不絕對,如果R矢量化編程做得好的話(有點小難度),會
使R的速度和程序的長度都有顯著性提升。
R的優勢在於有包羅萬象的統計函數可以調用,特別是在時間序列分析方面,無論是經典還是前沿的方法都有相應的包直接使用。
相比之下,Python之前在這方面貧乏不少。但是,現在Python有了
pandas。pandas提供了一組標準的時間序列處理工具和數據演算法。因此,你可以高效處理非常大的時間序列,輕松地進行切片/切塊、聚合、對定期
/不定期的時間序列進行重采樣等。可能你已經猜到了,這些工具中大部分都對金融和經濟數據尤為有用,但你當然也可以用它們來分析伺服器日誌數據。於是,近
年來,由於Python有不斷改良的庫(主要是pandas),使其成為數據處理任務的一大替代方案。
做過幾個實驗:
1. 用python實現了一個統計方法,其中用到了ctypes,multiprocess。
之後一個項目要做方法比較,又用回R,發現一些bioconctor上的包已經默認用parallel了。(但那個包還是很慢,一下子把所有線程都用掉了,導致整個電腦使用不能,看網頁非常卡~)
2. 用python pandas做了一些數據整理工作,類似資料庫,兩三個表來回查、匹配。感覺還是很方便的。雖然這些工作R也能做,但估計會慢點,畢竟幾十萬行的條目了。
3. 用python matplotlib畫圖。pyplot作圖的方式和R差異很大,R是一條命令畫點東
西,pylot是准備好了以後一起出來。pyplot的顏色選擇有點尷尬,默認顏色比較少,之後可用html的顏色,但是名字太長了~。pyplot
的legend比R 好用多了,算是半自動化了。pyplot畫出來後可以自由拉升縮放,然後再保存為圖片,這點比R好用。
總的來說Python是一套比較平衡的語言,各方面都可以,無論是對其他語言的調用,和數據源的連接、讀取,對系統的操作,還是正則表達和文字處
理,Python都有著明顯優勢。
而R是在統計方面比較突出。但是數據分析其實不僅僅是統計,前期的數據收集,數據處理,數據抽樣,數據聚類,以及比較復雜的數據挖掘演算法,數據建模等等
這些任務,只要是100M以上的數據,R都很難勝任,但是Python卻基本勝任。
結合其在通用編程方面的強大實力,我們完全可以只使用Python這一種語言去構建以數據為中心的應用程序。
但世上本沒有最好的軟體或程序,也鮮有人能把單一語言挖掘運用到極致。尤其是很多人早先學了R,現在完全不用又捨不得,所以對於想要學以致用的人來說,如果能把R和Python相結合,就更好不過了。
⑧ 求教大神,做數據分析是r方便還是python方便
2013年之前R是學術界的主流,但是現在Python正在慢慢取代R在學術界的地位。所以建議使用python來完成數據分析
⑨ 數據分析師用r和python哪個好
python更好,R語言比較局限,並且分析的話python的擴展性更強,並且能夠嵌入到APP內進行機器學習演算法的計算,可以實現實時推薦系統。
⑩ python相比於R,在數據分析上有哪些優勢
R語言對大的數據流處理很一般,因為整個r-base只有幾十兆。
Pyhton有自己的pandas庫和numpy庫, 結合matplotlib可以實現大數據的處理和數據的可視化。