HDFS分散式檔案系統
分散式檔案系統(Hadoop Distributed File System)是Hadoop核心子專案,為Hadoop提供了一個綜合性的檔案系統抽象,並且只會實現了多類檔案系統的介面。HDFS基於流式資料訪問、儲存和處理超大檔案。
在HDFS中引入了存放後設資料資訊的伺服器:NameNode和實際存放資料的伺服器:DataNode。
HDFS有著顯著的特點
-
儲存資料較大
執行在HDFS的應用程式的資料處理有較大的需求,從儲存GB到儲存TB級別的超大檔案,在目前的實際應用中,HDFS以及被利用來管理儲存PB級別的資料
-
支援多硬體平臺
Hadoop可以執行在廉價、異構的商用硬體叢集上,並且可以在HDFS設計時充分考慮資料的可靠性、安全性、高可用性
-
支援流式資料
HDFS有一個設計思路是“寫入一次,多次讀取”、資料來源生成資料集後,會被複制分發到不同的儲存節點,已用於響應資料分析任務的請求。HDFS放寬了可移植作業系統介面的要求,可以以流的形式訪問檔案系統中的資料
-
資料的一致性高
因為採用“寫入一次,多次讀取”的策略,所以支援追加不支援多次修改,降低了資料不一致性的造成可能
-
有效預防硬體失效
HDFS的設計能夠有效預防硬體異常並且具有自動恢復資料的能力
-
高容錯性
HDFS能夠自動儲存資料的多個副本,並且能夠自動將失敗的任務重新發配,具有高容錯性
所以,HDFS經常被使用於各個場景下,例如:
大資料儲存:分散式儲存
日誌處理:擅長日誌分析
ETL:資料可抽取到MYSQL,oracle,Lucene
機器學習
搜尋引擎
但是,相對於的,HDFS也有不適應的地方
不適合低延遲的資料訪問
HDFS不適合處理那些資料訪問要求低延遲的請求,因為HDFS主要是為了高資料的吞吐設計的,會產生稿時間延遲的代價
無法高效的儲存大量小檔案
HDFS採用主從架構來儲存資料,需要用到NameNode來管理檔案系統的後設資料,以響應請求。為了快速響應請求,後設資料存在主節點的記憶體中,如果小檔案數量多達,容易造成記憶體不足,導致系統錯誤
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69917874/viewspace-2696464/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 分散式檔案系統-HDFS分散式
- Hadoop 系列(一)—— 分散式檔案系統 HDFSHadoop分散式
- 大資料 | 分散式檔案系統 HDFS大資料分散式
- 分散式檔案系統(HDFS)與 linux系統檔案系統 對比分散式Linux
- Hadoop基礎(一):分散式檔案系統HDFSHadoop分散式
- Hadoop學習(一)——HDFS分散式檔案系統Hadoop分散式
- Hadoop分散式檔案系統(HDFS)會不會被淘汰?Hadoop分散式
- 必須掌握的分散式檔案儲存系統—HDFS分散式
- HDFS架構指南(分散式系統Hadoop的檔案系統架構)架構分散式Hadoop
- Hadoop 三劍客之 —— 分散式檔案儲存系統 HDFSHadoop分散式
- Hadoop HDFS分散式檔案系統 常用命令彙總Hadoop分散式
- 分散式檔案系統分散式
- 分散式檔案系統HDFS,大資料儲存實戰(一)分散式大資料
- 掃盲:Hadoop分散式檔案系統(HDFS)基礎概念講解!Hadoop分散式
- 架構師入門必看系列,分散式檔案系統HDFS解讀架構分散式
- cephFS分散式檔案系統操作分散式
- FastDFS-分散式檔案系統AST分散式
- 部署GPS分散式檔案系統分散式
- 分散式檔案系統之 FastDFS分散式AST
- WebHDFS :通過Web訪問Hadoop分散式檔案系統 (HDFS)的開源工具WebHadoop分散式開源工具
- AspNetCore分散式檔案上傳系統NetCore分散式
- GFS分散式檔案系統部署解析分散式
- 【史上最全】Hadoop 核心 - HDFS 分散式檔案系統詳解(上萬字建議收藏)Hadoop分散式
- 好程式設計師大資料學習路線分享分散式檔案系統HDFS程式設計師大資料分散式
- Linux系統中常見的分散式檔案系統推薦!Linux分散式
- FASTDFS開源分散式檔案系統介紹AST分散式
- 分散式檔案系統之FastDFS安裝部署分散式AST
- 分散式檔案儲存hdfs簡介及常用命令分散式
- 大資料檔案儲存系統HDFS大資料
- Google分散式檔案系統GFS論文學習Go分散式
- 分散式檔案系統之MogileFS的安裝使用分散式
- 分散式檔案系統fastdfs安裝以及python呼叫分散式ASTPython
- 分散式檔案系統fastdfs_搭建和基本使用分散式AST
- 隨行付微服務之分散式檔案系統微服務分散式
- 分散式檔案系統如何做?終於有個人把分散式檔案上傳講清楚了分散式
- 最簡單的分散式檔案系統 go-fastdfs分散式GoAST
- HDFS分散式儲存分散式
- 常見開源分散式檔案系統架構對比分散式架構