06、hdfs檔案儲存
1、上傳一個大於128M的檔案
hadoop fs -put ./hadoop-2.7.3.tar.gz /
2、檢視hdfs下所有檔案
hadoop fs -ls /
3、檢視控制頁面:http://192.168.1.10:50070/explorer.html#/
可以發現hadoop-2.7.3.tar.gz佔了2個block
4.1、hdfs預設儲存檔案是3份,可以改成2份
vim /hadoop/etc/hadop/hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
4.2、重啟hdfs:stop-dfs.sh start-dfs.sh
4.3、再次上傳一個檔案:hadoop fs -put jdk-8u131-linux-x64.tar.gz /
4.4、控制檯檢視,只有2份了
5.1、測試一臺機器掛掉,其中一個block會自動複製到正在執行的其他節點上
dfs.namenode.heartbeat.recheck-interval:每隔一段時間會檢查是否有機器掛掉,然後把它上面的檔案複製到其他機器上
vim /hadoop/etc/hadop/hdfs-site.xml
<property>
<name>dfs.namenode.heartbeat.recheck-interval</name>
<value>10000</value>
</property>
5.2、重啟,此時jdk-8u131-linux-x64.tar.gz的儲存情況是:
block0: slave1,slave3
block1: slave1,slave2
5.3、關閉slave3: hadoop-daemon.sh stop datanode
5.4、監控介面
總結:hdfs就是一塊空間無限大的硬碟,受制於NameNode記憶體的大小,知道NameNode那臺機器記憶體的大小
NameNode儲存系統的後設資料,包括目錄結構,分塊情況,每一塊在哪臺機器上,許可權資訊
DataNode儲存真正資料的資訊,DataNode自動做備份,預設份數為3(可以自己改,最多512份),一臺機器掛掉導致份數不夠,會自動複製到其他機器上。空間不夠,可以加一臺機器,配置好core-site.xml即可被自動識別
相關文章
- 大資料檔案儲存系統HDFS大資料
- 如何獲取HDFS上檔案的儲存位置
- 必須掌握的分散式檔案儲存系統—HDFS分散式
- 大量小檔案不適合儲存於HDFS的原因
- Hdfs儲存策略
- Hadoop 基石HDFS 一文了解檔案儲存系統Hadoop
- 分散式檔案儲存hdfs簡介及常用命令分散式
- 塊儲存 檔案儲存 物件儲存物件
- HDFS分散式儲存分散式
- Hadoop 三劍客之 —— 分散式檔案儲存系統 HDFSHadoop分散式
- 分散式檔案系統HDFS,大資料儲存實戰(一)分散式大資料
- 檔案儲存
- 資料儲存--檔案儲存
- CSV檔案儲存
- Flutter持久化儲存之檔案儲存Flutter持久化
- Android 檔案儲存Android
- hive檔案儲存格式Hive
- 儲存檔案到本地
- InnoDB儲存引擎檔案儲存引擎
- android: 檔案儲存Android
- 儲存json檔案JSON
- 物件儲存 vs 檔案儲存 vs 塊儲存,選哪個?物件
- RAC歸檔配置方案:使用NFS共享儲存儲存歸檔檔案NFS
- 什麼是HDFS 分散式儲存分散式
- IOS資料儲存之檔案沙盒儲存iOS
- 企業檔案安全儲存
- IPFS的檔案儲存模式模式
- 修改並儲存hosts檔案
- CIFS檔案的儲存————SMB
- Android中的資料儲存之檔案儲存Android
- hdfs小檔案分析
- Matlab將.mat檔案儲存為.txt檔案Matlab
- 如何將MAC的檔案儲存至NAS網路儲存?Mac
- CEPH分散式儲存搭建(物件、塊、檔案三大儲存)分散式物件
- Android 檔案儲存淺析Android
- python 儲存檔案jsonPythonJSON
- Python -讀取,儲存檔案Python
- App檔案儲存 getFilesDir()--getExternalFilesDir()APP