Hadoop的HDFS 入門使用

banq發表於2013-07-30

HDFS for the Batch Layer | Architects Zone一文詳細介紹了Hadoop的兩個組成部分之一HDFS。

當我們上傳一個檔案到HDFS，將自動分塊到各個資料節點上。對於初學者，文章建議下載Cloudera, Hortonworks, 和 MapR 的Hadoop虛擬機器，節省配置時間。

上傳檔案大概步驟：
$ hadoop fs -mkdir /logins
$ hadoop fs -put logins-2012-10-25.txt /logins

這是將logins-2012-10-25.txt 日誌檔案上傳到logins目錄。查詢可見：
$ hadoop fs -ls -R /logins
-rw-r--r-- 3 hdfs hadoop 175802352 2012-10-26 01:38
/logins/logins-2012-10-25.txt

能夠如Linux的shell命令一下檢視檔案內容：
$ hadoop fs -cat /logins/logins-2012-10-25.txt
alex 192.168.12.125 Thu Oct 25 22:33 - 22:46 (00:12)
bob 192.168.8.251 Thu Oct 25 21:04 - 21:28 (00:24)
...

為了檢視上傳的日誌檔案分塊到哪些伺服器資料節點上，用如下命令：

$ hadoop fsck /logins/logins-2012-10-25.txt -files -blocks -locations 
/logins/logins-2012-10-25.txt 175802352 bytes, 2 block(s):                         A
OK 
0. blk_-1821909382043065392_1523 len=134217728                                     B
   repl=3 [10.100.0.249:50010, 10.100.1.4:50010, 10.100.0.252:50010] 
1. blk_2733341693279525583_1524 len=41584624 
   repl=3 [10.100.0.255:50010, 10.100.1.2:50010, 10.100.1.5:50010] 
<p class="indent">

這個檔案被存成兩塊，其對應的IP地址和埠。

Hadoop的HDFS架構入門
2022-01-25
Hadoop架構
Hadoop 基礎之 HDFS 入門
2019-05-13
Hadoop
Hadoop 入門筆記—核心元件 HDFS
2021-11-19
Hadoop筆記元件
Hadoop入門（二）之 HDFS 詳細解析
2018-09-11
Hadoop
建立HDFS，匯入HADOOP jar包
2020-12-09
HadoopJAR
Hadoop–HDFS
2018-12-20
Hadoop
HDFS入門概述
2020-07-03
Hadoop學習之路（十）HDFS API的使用
2018-03-21
HadoopAPI
Hadoop HDFS(一)
2018-05-24
Hadoop
Hadoop HDFS（二）
2018-05-31
Hadoop
root加到hadoop的hdfs使用者組內
2023-03-01
Hadoop
詳解HDFS入門
2021-04-27
Hadoop快速入門
2021-02-04
Hadoop
HDFS 命令：用於管理HDFS的Hadoop Shell命令大全
2021-12-29
Hadoop
Hadoop入門系列(2)-安裝Hadoop
2020-12-02
Hadoop
菜鳥的Hadoop快速入門
2019-08-09
Hadoop
【HDFS】HADOOP DISTRIBUTED FILE SYSTEM
2018-11-19
Hadoop
Hadoop（十）HDFS API操作
2024-09-14
HadoopAPI
Hadoop原理之——HDFS原理
2021-09-09
Hadoop
hadoop學習-HDFS的詳細概述
2020-12-17
Hadoop
Hadoop HDFS 設計隨想
2018-12-07
Hadoop
hadoop hdfs 常用命令
2023-09-28
Hadoop
Hadoop KMS配置(HDFS透明加密)
2020-06-06
Hadoop加密
Hadoop面試題之HDFS
2021-12-23
Hadoop面試題
Hadoop學習筆記—HDFS
2021-04-03
Hadoop筆記
hadoop-HDFS優缺點
2020-12-02
Hadoop
Hadoop 專欄 - MapReduce 入門
2021-01-21
Hadoop
Hadoop hdfs完全分散式搭建教程
2019-01-17
Hadoop分散式
hadoop之上傳資料到hdfs模式
2020-10-03
Hadoop模式
Hadoop系列之HDFS 資料塊
2022-01-19
Hadoop
（一）hadoop叢集搭建——1.4hdfs的操作
2020-12-21
Hadoop
企業使用Hadoop的重大挑戰：如何在HDFS中組織和使用資料？
2018-09-28
Hadoop
Hadoop入門（一）之Hadoop偽分散式環境搭建
2018-09-04
Hadoop分散式
寫給後端的Hadoop初級入門教程：Hadoop組成部分。
2019-12-12
後端Hadoop
Hadoop學習之路（六）HDFS基礎
2019-01-23
Hadoop
Hadoop配置hdfs-site.xml詳解
2024-03-14
HadoopXML
Hadoop框架：HDFS高可用環境配置
2020-10-27
Hadoop框架
Hadoop官網翻譯之HDFS Architecture
2019-01-01
Hadoop
Hadoop技術內幕：深入解析Hadoop和HDFS 1.3準備 Hadoop 原始碼
2018-09-25
Hadoop原始碼

Hadoop的HDFS 入門使用

相關文章