使用Python分析大量資料應該學些什麼?
如果您想使用 Python 分析大量資料,該研究什麼?
對於大資料,我們不能相信只有語言就足夠了。Python 之所以合適,是因為它可以方便地管理數學庫、簡潔且易於管理異構和多維資料結構,但大資料還需要 IT 結構。例如,我們需要一個系統來管理非常大的檔案,並且我們需要結構來對映和減少這些巨大的檔案。
Apache Hadoop及其專用的 HDFS 檔案系統已成功解決了這些問題。
Python 通過Pydoop 庫與它驚人地互動。
推薦的步驟如下:
- 從兩個方面開始:學習必要的數學,通過您編寫的簡單教育程式加深 Python 的各個方面。通過這種方式,您將同時學習 Python 和所需的數學,您將學習在程式碼中以實用的方式使用數學。
- 只有當你對前一點感到非常強大時,研究它是如何工作的以及如何安裝hadoop,開始玩pydoop,做一些非常簡單的事情:儘管庫和語言在理論上很簡單,但這將是一個荊棘床。
- 一旦你瞭解了這些工具,就可以找到一些實際的應用程式並投入使用。它將付出痛苦和棄絕、迷失的夜晚和各種詛咒的代價。你經常會想放手,不要。
- 一旦您解決了一些實際問題,您將準備好在使用大資料的工作世界中面對自己。顯然你會非常初級,一開始會非常困難。如果您沒有明確的行業工作路徑,請使用您的案例研究來介紹自己。
相關文章
- 下一代 3DTiles(Next)詳解 [2] 瓦片資料內容擴充套件之 3DTILES_content_gltf
- python能做什麼專案-這十個Python實戰專案,讓你瞬間讀懂Python!
- Python爬蟲專案100例,附原始碼!100個Python爬蟲練手例項
- Python開發實戰
- Python中hash加密
- 為什麼說Python適合做大資料處理?原因竟是它!
- Python是什麼意思?Python有什麼用?
- 🏆【Alibaba中介軟體技術系列】「Nacos技術專題」服務註冊與發現相關的原理分析
- JavaScript 基本資料型別轉換
- 輕鬆實現織夢網站資料遷移到新站點
- 微服務架構 | *2.3 Spring Cloud 啟動及載入配置檔案原始碼分析(以 Nacos 為例)
- Firefox Relay 被加入 GitHub「臨時郵箱」專案,引發大量使用者不滿
- python實戰一個完整的專案-年終課程盤點|16 個 Python 綜合實戰專案合集
- 《Python3網路爬蟲開發實戰(第二版)》內容介紹
- 整理了70個Python實戰專案案例,教程+原始碼+筆記。從基礎到深入
- Python中的不可變集合