hadoop-HDFS優缺點
一、HDFS優缺點
1、優點:
1、高容錯性:
2、資料量大:
3、流式訪問:
4、擴充套件成本低:
2、缺點
1、不適合低延時:IO操作頻繁
2、不可以併發:沒有事務,沒有鎖機制
3、不實用資料量小的檔案:佔空間(一個檔案塊block預設128M),定址慢(資料分佈在多個NN節點上)
二、HDFS架構及各角色的作用
1、client:客戶端
決定切塊的大小、副本的數量。可以通過linux windows命令,也可以通過java、scala、pathon等操作
2、NameNode:
後設資料節點,負責處理客戶端的請求
3、DataNode
資料節點,儲存和檢索檔案塊,執行資料讀寫操作
4、SecondaryNameNode
合併edit_log到fsimage中,輔助NameNode完成記憶體中後設資料的持久化
三、hadoop環境搭建主要流程
1、檢查防火牆的狀態,若開啟,則關閉
2、虛擬機器免密登陸設定
3、檢查jdk是否安裝,若沒有,則安裝
4、解壓檔案至指定目錄
5、配置環境變數(bin/sbin)並啟用
6、配置hdfs(etc/hadoop)
hadoop-env.sh
core-site.xml
hdfs-site.xml
7、格式化namenode
建立tmp/name tmp/data
執行hdfs namenode -format
8、配置yarn
yarn-site.xml
mapred-site.xml
9、配置完成,啟動服務
start-dfs.sh
start-yarn.sh
相關文章
- Hive 優缺點Hive
- MapReduce優缺點
- RabbitMQ優缺點MQ
- HTTPS 優點與缺點HTTP
- Docker的優缺點Docker
- 內聯的優缺點
- HTTP1.1 優缺點HTTP
- Ajax原理以及優缺點
- 繼承的優缺點繼承
- serverless與容器優缺點Server
- MySQL索引的優缺點MySql索引
- 節點快取的優缺點快取
- MyBatis的優缺點以及特點MyBatis
- 繼承的優點和缺點繼承
- iframe有哪些優點和缺點?
- Java單例模式:缺點和優點Java單例模式
- PyLint 的優點、缺點和危險
- Git版本控制與優缺點Git
- 關於 Cookie的優缺點Cookie
- docker簡介以及優缺點Docker
- HTTP和RPC的優缺點HTTPRPC
- Kmeans演算法優缺點演算法
- 閉包的概念?優缺點?
- Base64 的優缺點
- kafka的優缺點都有那些Kafka
- SAP的概念及優缺點
- 6.iframe的優缺點
- ERP系統有哪些優點和缺點?
- MVP 與 MVVM 優缺點總結MVPMVVM
- svn和git版本管理優缺點Git
- 深度學習(Deep Learning)優缺點深度學習
- rem佈局原理和優缺點REM
- 串列埠、IIC、SPI的優缺點串列埠
- 雲伺服器的優缺點伺服器
- 物聯網路卡的優缺點
- 代理伺服器的優缺點伺服器
- 單頁應用的優缺點
- 也談SAP系統優缺點