使用Python分析大量資料應該學些什麼?
如果您想使用 Python 分析大量資料,該研究什麼?
對於大資料,我們不能相信只有語言就足夠了。Python 之所以合適,是因為它可以方便地管理數學庫、簡潔且易於管理異構和多維資料結構,但大資料還需要 IT 結構。例如,我們需要一個系統來管理非常大的檔案,並且我們需要結構來對映和減少這些巨大的檔案。
Apache Hadoop及其專用的 HDFS 檔案系統已成功解決了這些問題。
Python 透過Pydoop 庫與它驚人地互動。
推薦的步驟如下:
- 從兩個方面開始:學習必要的數學,透過您編寫的簡單教育程式加深 Python 的各個方面。透過這種方式,您將同時學習 Python 和所需的數學,您將學習在程式碼中以實用的方式使用數學。
- 只有當你對前一點感到非常強大時,研究它是如何工作的以及如何安裝hadoop,開始玩pydoop,做一些非常簡單的事情:儘管庫和語言在理論上很簡單,但這將是一個荊棘床。
- 一旦你瞭解了這些工具,就可以找到一些實際的應用程式並投入使用。它將付出痛苦和棄絕、迷失的夜晚和各種詛咒的代價。你經常會想放手,不要。
- 一旦您解決了一些實際問題,您將準備好在使用大資料的工作世界中面對自己。顯然你會非常初級,一開始會非常困難。如果您沒有明確的行業工作路徑,請使用您的案例研究來介紹自己。
相關文章
- 為什麼學習Python資料分析Python
- 為什麼使用Python做資料分析?Python
- 中小學生Python課應該學什麼Python
- k8s應該怎麼學習?要學些什麼?K8S
- Python 集合是什麼,為什麼應該使用以及如何使用?Python
- 為什麼資料科學家應該開始學習Swift?資料科學Swift
- Python資料分析庫之pandas,你該這麼學!No.1Python
- 為什麼 Python 開發人員應該使用 PipenvPython
- 什麼是API資料介面該怎麼使用?API
- 技術面試應該問些什麼?應聘者應該如何應對?面試
- 以就業為目標,Python到底應該學什麼?就業Python
- 大資料學習大綱,大資料應該怎麼學大資料
- Python——你應該知道這些Python
- 哪些人可以學習資料分析?為什麼學資料分析?
- 應該使用什麼 CI/CD 工具?
- 雲端計算應該學些什麼?Linux雲端計算要學多久Linux
- Python資料分析師主要做什麼?Python基礎Python
- Web前端到底需要學什麼?應該怎麼學?Web前端
- CPDA資料分析師:為什麼Python在資料科學方面超越R和SQL?Python資料科學SQL
- 大量STATSPACK資料統計分析
- 零基礎學UI應該學什麼?UI
- Python培訓分享:如何做資料分析,資料分析流程是什麼?Python
- 網站設計的時候應該注意些什麼網站
- 為什麼資料庫中大量的server process沒有對應的session?資料庫ServerSession
- 大資料為什麼這麼火?小白該如何去學習大資料大資料
- 為什麼Python停止執行?該如何應對?Python
- 對於Linux,我們應該學什麼?Linux
- python資料分析-Anaconda使用Python
- 資料分析師與資料科學家有什麼不同? - Reddit資料科學
- 資料分析用python語言有什麼好處?Python
- 大資料分析師要學什麼專業?大資料
- 從0開始學習大資料探勘分析,新手應該這樣學習大資料分析才靠譜大資料
- 資料倉儲應該用什麼方案——資料倉儲實施方案概述
- 大會資料下載|熱門技術風口下開發者應該關注些什麼?
- 一份優秀的資料分析報告應該具備這些要點!
- python學習之什麼是組合資料?Python
- 如何使用python多執行緒有效爬取大量資料?Python執行緒
- 單元測試-mock使用應該注意什麼Mock