Hadoop的HDFS 入門使用
HDFS for the Batch Layer | Architects Zone一文詳細介紹了Hadoop的兩個組成部分之一HDFS。
當我們上傳一個檔案到HDFS,將自動分塊到各個資料節點上。對於初學者,文章建議下載Cloudera, Hortonworks, 和 MapR 的Hadoop虛擬機器,節省配置時間。
上傳檔案大概步驟:
$ hadoop fs -mkdir /logins
$ hadoop fs -put logins-2012-10-25.txt /logins
這是將logins-2012-10-25.txt 日誌檔案上傳到logins目錄。查詢可見:
$ hadoop fs -ls -R /logins
-rw-r--r-- 3 hdfs hadoop 175802352 2012-10-26 01:38
/logins/logins-2012-10-25.txt
能夠如Linux的shell命令一下檢視檔案內容:
$ hadoop fs -cat /logins/logins-2012-10-25.txt
alex 192.168.12.125 Thu Oct 25 22:33 - 22:46 (00:12)
bob 192.168.8.251 Thu Oct 25 21:04 - 21:28 (00:24)
...
為了檢視上傳的日誌檔案分塊到哪些伺服器資料節點上,用如下命令:
這個檔案被存成兩塊,其對應的IP地址和埠。
當我們上傳一個檔案到HDFS,將自動分塊到各個資料節點上。對於初學者,文章建議下載Cloudera, Hortonworks, 和 MapR 的Hadoop虛擬機器,節省配置時間。
上傳檔案大概步驟:
$ hadoop fs -mkdir /logins
$ hadoop fs -put logins-2012-10-25.txt /logins
這是將logins-2012-10-25.txt 日誌檔案上傳到logins目錄。查詢可見:
$ hadoop fs -ls -R /logins
-rw-r--r-- 3 hdfs hadoop 175802352 2012-10-26 01:38
/logins/logins-2012-10-25.txt
能夠如Linux的shell命令一下檢視檔案內容:
$ hadoop fs -cat /logins/logins-2012-10-25.txt
alex 192.168.12.125 Thu Oct 25 22:33 - 22:46 (00:12)
bob 192.168.8.251 Thu Oct 25 21:04 - 21:28 (00:24)
...
為了檢視上傳的日誌檔案分塊到哪些伺服器資料節點上,用如下命令:
$ hadoop fsck /logins/logins-2012-10-25.txt -files -blocks -locations /logins/logins-2012-10-25.txt 175802352 bytes, 2 block(s): A OK 0. blk_-1821909382043065392_1523 len=134217728 B repl=3 [10.100.0.249:50010, 10.100.1.4:50010, 10.100.0.252:50010] 1. blk_2733341693279525583_1524 len=41584624 repl=3 [10.100.0.255:50010, 10.100.1.2:50010, 10.100.1.5:50010] <p class="indent"> |
這個檔案被存成兩塊,其對應的IP地址和埠。
相關文章
- Hadoop的HDFS架構入門Hadoop架構
- Hadoop 基礎之 HDFS 入門Hadoop
- Hadoop 入門筆記—核心元件 HDFSHadoop筆記元件
- Hadoop入門(二)之 HDFS 詳細解析Hadoop
- hadoop hdfs 命令使用Hadoop
- HDFS入門概述
- 建立HDFS,匯入HADOOP jar包HadoopJAR
- 詳解HDFS入門
- Hadoop–HDFSHadoop
- Hadoop學習之路(十)HDFS API的使用HadoopAPI
- Hadoop HDFS(二)Hadoop
- Hadoop HDFS(一)Hadoop
- hadoop命令——hdfsHadoop
- hadoop 入門Hadoop
- root加到hadoop的hdfs使用者組內Hadoop
- Hadoop Shell命令 |HDFS Shell命令| HDFS 命令Hadoop
- HDFS Federation(HDFS 聯邦)(Hadoop2.3)Hadoop
- 【Hadoop】HDFS的執行原理Hadoop
- hadoop: hdfs API示例HadoopAPI
- HDFS 命令:用於管理HDFS的Hadoop Shell命令大全Hadoop
- Hadoop快速入門Hadoop
- hadoop之 HDFS-Hadoop存檔Hadoop
- ORACLE連線HADOOP(3) - OLH載入HDFS資料OracleHadoop
- 菜鳥的Hadoop快速入門Hadoop
- Hadoop面試題之HDFSHadoop面試題
- Hadoop原理之——HDFS原理Hadoop
- Hadoop筆記HDFS(1)Hadoop筆記
- Hadoop筆記HDFS(2)Hadoop筆記
- 漫談Hadoop HDFS BalancerHadoop
- hadoop hdfs命令彙總Hadoop
- hadoop 2.0 hdfs HA 搭建Hadoop
- Apache Hadoop 入門教程ApacheHadoop
- Hadoop入門系列(2)-安裝HadoopHadoop
- hadoop學習-HDFS的詳細概述Hadoop
- Hadoop如何設定HDFS的塊大小Hadoop
- Hadoop實驗——熟悉常用的HDFS操作Hadoop
- Hadoop重新格式化HDFS的方法Hadoop
- Hadoop KMS配置(HDFS透明加密)Hadoop加密