使用Python分析大量資料應該學些什麼?
如果您想使用 Python 分析大量資料,該研究什麼?
對於大資料,我們不能相信只有語言就足夠了。Python 之所以合適,是因為它可以方便地管理數學庫、簡潔且易於管理異構和多維資料結構,但大資料還需要 IT 結構。例如,我們需要一個系統來管理非常大的檔案,並且我們需要結構來對映和減少這些巨大的檔案。
Apache Hadoop及其專用的 HDFS 檔案系統已成功解決了這些問題。
Python 透過Pydoop 庫與它驚人地互動。
推薦的步驟如下:
- 從兩個方面開始:學習必要的數學,透過您編寫的簡單教育程式加深 Python 的各個方面。透過這種方式,您將同時學習 Python 和所需的數學,您將學習在程式碼中以實用的方式使用數學。
- 只有當你對前一點感到非常強大時,研究它是如何工作的以及如何安裝hadoop,開始玩pydoop,做一些非常簡單的事情:儘管庫和語言在理論上很簡單,但這將是一個荊棘床。
- 一旦你瞭解了這些工具,就可以找到一些實際的應用程式並投入使用。它將付出痛苦和棄絕、迷失的夜晚和各種詛咒的代價。你經常會想放手,不要。
- 一旦您解決了一些實際問題,您將準備好在使用大資料的工作世界中面對自己。顯然你會非常初級,一開始會非常困難。如果您沒有明確的行業工作路徑,請使用您的案例研究來介紹自己。
相關文章
- 為什麼你應該學 Python ?Python
- 資料庫該學什麼!!!!資料庫
- 為什麼學習Python資料分析Python
- k8s應該怎麼學習?要學些什麼?K8S
- 為什麼使用Python做資料分析?Python
- 中小學生Python課應該學什麼Python
- Python 集合是什麼,為什麼應該使用以及如何使用?Python
- ABAP開發人員未來應該學些什麼
- 為什麼資料科學家應該開始學習Swift?資料科學Swift
- 想搞資料探勘分析,應該學習java還是python?JavaPython
- 為什麼學校應該使用自由軟體
- 技術面試應該問些什麼?應聘者應該如何應對?面試
- Python資料分析庫之pandas,你該這麼學!No.1Python
- 什麼是API資料介面該怎麼使用?API
- 雲端計算應該學些什麼?Linux雲端計算要學多久Linux
- 為什麼 Python 開發人員應該使用 PipenvPython
- 大資料學習大綱,大資料應該怎麼學大資料
- 應該使用什麼 CI/CD 工具?
- 哪些人可以學習資料分析?為什麼學資料分析?
- 以就業為目標,Python到底應該學什麼?就業Python
- Web前端到底需要學什麼?應該怎麼學?Web前端
- 準媽媽應該做什麼和不做什麼–資料資訊圖
- 「譯」Python 專案應該都有什麼?Python
- 零基礎學UI應該學什麼?UI
- 有了資料,需要一些思路。應該從哪開始做資料分析?
- 什麼時候該使用NoSQL儲存資料庫?SQL資料庫
- 大資料為什麼這麼火?小白該如何去學習大資料大資料
- 大資料產品到底應該是什麼形態?大資料
- 資料操作返回的ArrayList裡應該放什麼呢?
- 大會資料下載|熱門技術風口下開發者應該關注些什麼?
- 網站設計的時候應該注意些什麼網站
- 非 IT 的朋友找 IT 工作,應該學什麼?
- Python——你應該知道這些Python
- 為什麼資料庫中大量的server process沒有對應的session?資料庫ServerSession
- 關於資料科學家,我們應該知道的這些事資料科學
- flux架構淺談:什麼資料才應該放storeUX架構
- 往linux核心掛鉤子–什麼應該什麼不應該Linux
- Python培訓分享:如何做資料分析,資料分析流程是什麼?Python