Hadoop的HDFS 入門使用
HDFS for the Batch Layer | Architects Zone一文詳細介紹了Hadoop的兩個組成部分之一HDFS。
當我們上傳一個檔案到HDFS,將自動分塊到各個資料節點上。對於初學者,文章建議下載Cloudera, Hortonworks, 和 MapR 的Hadoop虛擬機器,節省配置時間。
上傳檔案大概步驟:
$ hadoop fs -mkdir /logins
$ hadoop fs -put logins-2012-10-25.txt /logins
這是將logins-2012-10-25.txt 日誌檔案上傳到logins目錄。查詢可見:
$ hadoop fs -ls -R /logins
-rw-r--r-- 3 hdfs hadoop 175802352 2012-10-26 01:38
/logins/logins-2012-10-25.txt
能夠如Linux的shell命令一下檢視檔案內容:
$ hadoop fs -cat /logins/logins-2012-10-25.txt
alex 192.168.12.125 Thu Oct 25 22:33 - 22:46 (00:12)
bob 192.168.8.251 Thu Oct 25 21:04 - 21:28 (00:24)
...
為了檢視上傳的日誌檔案分塊到哪些伺服器資料節點上,用如下命令:
這個檔案被存成兩塊,其對應的IP地址和埠。
當我們上傳一個檔案到HDFS,將自動分塊到各個資料節點上。對於初學者,文章建議下載Cloudera, Hortonworks, 和 MapR 的Hadoop虛擬機器,節省配置時間。
上傳檔案大概步驟:
$ hadoop fs -mkdir /logins
$ hadoop fs -put logins-2012-10-25.txt /logins
這是將logins-2012-10-25.txt 日誌檔案上傳到logins目錄。查詢可見:
$ hadoop fs -ls -R /logins
-rw-r--r-- 3 hdfs hadoop 175802352 2012-10-26 01:38
/logins/logins-2012-10-25.txt
能夠如Linux的shell命令一下檢視檔案內容:
$ hadoop fs -cat /logins/logins-2012-10-25.txt
alex 192.168.12.125 Thu Oct 25 22:33 - 22:46 (00:12)
bob 192.168.8.251 Thu Oct 25 21:04 - 21:28 (00:24)
...
為了檢視上傳的日誌檔案分塊到哪些伺服器資料節點上,用如下命令:
$ hadoop fsck /logins/logins-2012-10-25.txt -files -blocks -locations /logins/logins-2012-10-25.txt 175802352 bytes, 2 block(s): A OK 0. blk_-1821909382043065392_1523 len=134217728 B repl=3 [10.100.0.249:50010, 10.100.1.4:50010, 10.100.0.252:50010] 1. blk_2733341693279525583_1524 len=41584624 repl=3 [10.100.0.255:50010, 10.100.1.2:50010, 10.100.1.5:50010] <p class="indent"> |
這個檔案被存成兩塊,其對應的IP地址和埠。
相關文章
- Hadoop的HDFS架構入門Hadoop架構
- Hadoop 基礎之 HDFS 入門Hadoop
- Hadoop 入門筆記—核心元件 HDFSHadoop筆記元件
- Hadoop入門(二)之 HDFS 詳細解析Hadoop
- 建立HDFS,匯入HADOOP jar包HadoopJAR
- Hadoop–HDFSHadoop
- HDFS入門概述
- Hadoop學習之路(十)HDFS API的使用HadoopAPI
- Hadoop HDFS(一)Hadoop
- Hadoop HDFS(二)Hadoop
- root加到hadoop的hdfs使用者組內Hadoop
- 詳解HDFS入門
- Hadoop快速入門Hadoop
- HDFS 命令:用於管理HDFS的Hadoop Shell命令大全Hadoop
- Hadoop入門系列(2)-安裝HadoopHadoop
- 菜鳥的Hadoop快速入門Hadoop
- 【HDFS】HADOOP DISTRIBUTED FILE SYSTEMHadoop
- Hadoop(十)HDFS API操作HadoopAPI
- Hadoop原理之——HDFS原理Hadoop
- hadoop學習-HDFS的詳細概述Hadoop
- Hadoop HDFS 設計隨想Hadoop
- hadoop hdfs 常用命令Hadoop
- Hadoop KMS配置(HDFS透明加密)Hadoop加密
- Hadoop面試題之HDFSHadoop面試題
- Hadoop學習筆記—HDFSHadoop筆記
- hadoop-HDFS優缺點Hadoop
- Hadoop 專欄 - MapReduce 入門Hadoop
- Hadoop hdfs完全分散式搭建教程Hadoop分散式
- hadoop之上傳資料到hdfs模式Hadoop模式
- Hadoop系列之HDFS 資料塊Hadoop
- (一)hadoop叢集搭建——1.4hdfs的操作Hadoop
- 企業使用Hadoop的重大挑戰:如何在HDFS中組織和使用資料?Hadoop
- Hadoop入門(一)之Hadoop偽分散式環境搭建Hadoop分散式
- 寫給後端的Hadoop初級入門教程:Hadoop組成部分。後端Hadoop
- Hadoop學習之路(六)HDFS基礎Hadoop
- Hadoop配置hdfs-site.xml詳解HadoopXML
- Hadoop框架:HDFS高可用環境配置Hadoop框架
- Hadoop官網翻譯之HDFS ArchitectureHadoop
- Hadoop技術內幕:深入解析Hadoop和HDFS 1.3準備 Hadoop 原始碼Hadoop原始碼