hadoop學習-HDFS的詳細概述

有上進心的阿龍發表於2020-12-17

namenode
datanode
secondarynamenode
講解HDFS主要研究這三個東西
hadoop客戶端的操作就是使用程式碼去實現上傳和下載。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
一個檔案的後設資料資訊大概是180位元組左右。(不管檔案多大)
hadoop怕小檔案
儲存的時候怕,計算分析的時候也怕。
namenode維護的後設資料全部在記憶體中。
對檔案的修改最多隻支援追加資料。
Hbase對hdfs提高了改操作。

client一定是先和namenode進行互動,再和datanode互動
讀檔案或者寫檔案必須先通過namenode才OK
在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述
2nn並不是nn的備份。2nn的資料肯定沒有nn的資料這麼全
當nn掛掉的時候,2nn並不能替換nn,只能乾著急。緊急情況是:複製2nn的資料給到nn
在這裡插入圖片描述
客戶端:準確的說,他不是hdfs的架構一部分。他就算是一個hadoop提供給我們操作hdfs的入口。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
128只是切塊的一個單位,衡量是否需要切塊的標準。實際檔案多大,存到hdfs就是多大。
刪除hdfs中的檔案
hadoop fs -rm -R /user/atguigu/output
在這裡插入圖片描述
在這裡插入圖片描述
hadoop fs -rm -R /tmp
在這裡插入圖片描述
開啟真實的儲存資料的那個檔案(內容=wc.input)
目錄:
/opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1418454027-192.168.1.102-1607949404504/current/finalized/subdir0/subdir0
在這裡插入圖片描述
不管是內容還是大小都完全相同
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
將jdk的壓縮包傳到hdfs的根目錄。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
從磁碟上去看:

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

相關文章