Python對Hadoop資料進行讀寫
首先需要借用第三方庫pyhdfs
建立一個Hadoop連線物件
hdfs_client = pyhdfs.HdfsClient(hdfs_ip,hdfs_port,hdfs_user)。
hdfs_ip:ip地址;hdfs_port:埠;hdfs_user:使用者名稱
還需要知道檔案路徑,比如:/hdoopTest/orderTest/xx.txt。
檢視檔案時使用的方法:
hdfs_client.listdir(‘/hdoopTest/orderTest’)
將檔案拉到本地:
hdfs.client.copy_to_local('/hdoopTest/orderTest/xx.txt','/local_path/xx.txt')
將本地檔案上傳到Hadoop:
hdfs.client.copy_from_local('/local_path/2xx.txt','/hdoopTest/orderTest/xx.txt')
從Hadoop中讀取資料
-
with hdfs.client.open(file)as f:
-
data_list = f.readlines( )
-
for data in data_list:
-
print(data.decode())
相關文章
- [python]使用xlrd對Excel表格進行讀寫操作PythonExcel
- Lazarus中對mysql資料庫Blob型別進行讀寫例子MySql資料庫型別
- C++中對檔案進行讀寫操作C++
- sails 配置waterline orm 進行redis資料讀寫AIORMRedis
- io流對資料的讀寫
- JavaScript 讀寫二進位制資料JavaScript
- 使用 OPEN CURSOR 和 FETCH NEXT CURSOR 對 SAP 資料庫表進行分塊讀寫試讀版資料庫
- python對資料集進行清洗與視覺化Python視覺化
- 使用Ganglia對hadoop進行監控Hadoop
- 通過ES-Hadoop實現Hive讀寫Elasticsearch資料HadoopHiveElasticsearch
- python對介面中的資料進行md5加密Python加密
- 呼叫ejb對本地檔案進行讀寫要如何做
- Python影像讀寫方法對比Python
- Java 共享資料讀寫(多執行緒)Java執行緒
- Python對系統資料進行採集監控——psutilPython
- matlab 對資料進行打亂Matlab
- 如何對資料目標進行分析
- sql對錶資料進行復制SQL
- 用python進行資料庫資料遷移Python資料庫
- SQLite入門(二)讀寫二進位制資料SQLite
- Pandas資料讀寫
- 資料讀寫流程
- 如何用Python進行資料分析?Python
- Python對字典進行排序Python排序
- 129.(位元組流、字元流)對檔案進行讀寫操作字元
- SQL對資料進行按月統計或對資料進行按星期統計的例項程式碼SQL
- java讀取excel為物件並進行讀寫操作JavaExcel物件
- Python讀寫二進位制檔案Python
- 每日 30 秒 ⏱ 對海量資料進行切割
- Oracle對資料進行加密&解密處理Oracle加密解密
- 分析從管理員角度對Hadoop進行調優Hadoop
- 資料讀寫壓力大,讀寫分離
- 用R讀取PDF並進行資料探勘
- 用一行Python進行資料收集探索Python
- 資料加密-國密SM2對資料進行加密加密
- 薦書 | 《利用Python進行資料分析》Python
- 用 Python 進行資料分析 pandas (一)Python
- PHP與Python進行資料互動PHPPython