Python對Hadoop資料進行讀寫
首先需要借用第三方庫pyhdfs
建立一個Hadoop連線物件
hdfs_client = pyhdfs.HdfsClient(hdfs_ip,hdfs_port,hdfs_user)。
hdfs_ip:ip地址;hdfs_port:埠;hdfs_user:使用者名稱
還需要知道檔案路徑,比如:/hdoopTest/orderTest/xx.txt。
檢視檔案時使用的方法:
hdfs_client.listdir(‘/hdoopTest/orderTest’)
將檔案拉到本地:
hdfs.client.copy_to_local('/hdoopTest/orderTest/xx.txt','/local_path/xx.txt')
將本地檔案上傳到Hadoop:
hdfs.client.copy_from_local('/local_path/2xx.txt','/hdoopTest/orderTest/xx.txt')
從Hadoop中讀取資料
-
with hdfs.client.open(file)as f:
-
data_list = f.readlines( )
-
for data in data_list:
-
print(data.decode())
相關文章
- Lazarus中對mysql資料庫Blob型別進行讀寫例子MySql資料庫型別
- 使用 OPEN CURSOR 和 FETCH NEXT CURSOR 對 SAP 資料庫表進行分塊讀寫試讀版資料庫
- io流對資料的讀寫
- 通過ES-Hadoop實現Hive讀寫Elasticsearch資料HadoopHiveElasticsearch
- python對資料集進行清洗與視覺化Python視覺化
- JavaScript 讀寫二進位制資料JavaScript
- Python影像讀寫方法對比Python
- python對介面中的資料進行md5加密Python加密
- Python對系統資料進行採集監控——psutilPython
- matlab 對資料進行打亂Matlab
- 如何用Python進行資料分析?Python
- Python對字典進行排序Python排序
- 如何對資料目標進行分析
- TensorFlow讀寫資料
- 資料讀寫流程
- 如何使用Hadoop捆綁的低階工具進行資料提取?Hadoop
- PHP與Python進行資料互動PHPPython
- 用 Python 進行資料分析 pandas (一)Python
- 薦書 | 《利用Python進行資料分析》Python
- 使用python進行合併資料集Python
- 使用 Python 進行資料視覺化Python視覺化
- 用一行Python進行資料收集探索Python
- SQL對資料進行按月統計或對資料進行按星期統計的例項程式碼SQL
- python讀取txt文字資料進行分詞並生成詞雲圖片Python分詞
- java讀取excel為物件並進行讀寫操作JavaExcel物件
- 資料讀寫壓力大,讀寫分離
- 每日 30 秒 ⏱ 對海量資料進行切割
- Pandas讀寫資料庫資料庫
- 資料加密-國密SM2對資料進行加密加密
- python-進階教程-對切片進行命名Python
- 使用 Python 進行資料分析:入門指南Python
- Python 連線mysql資料庫進行操作PythonMySql資料庫
- 如何使用Python 進行資料視覺化Python視覺化
- PHP 對資料進行驗證和過濾PHP
- 如何對DevOps資料庫進行原始碼控制dev資料庫原始碼
- Jmeter使用beanshell對資料進行加密傳輸JMeterBean加密
- JQuery對ASP.NET MVC資料進行操作jQueryASP.NETMVC
- [譯] 在 Python 中,如何運用 Dask 資料進行並行資料分析Python並行