Hadoop雖然強大 但不是萬能的
隨著 Hadoop 應用的不斷擴充,使很多人陷入了對它的盲目崇拜中,認為它能解決一切問題。雖然Hadoop是一個偉大的分散式大型資料計算的框架,但Hadoop不是萬能的。比如在下面這幾種場景就不適合使用Hadoop:
1、低延遲的資料訪問
Hadoop並不適用於需要實時查詢和低延遲的資料訪問。資料庫通過索引記錄可以降低延遲和快速響應,這一點單純的用Hadoop是沒有辦法代替的。但是如果你真的想要取代一個實時資料庫,可以嘗試一下HBase來實現資料庫實時讀寫。
2、結構化資料
Hadoop不適用於結構化資料,卻非常適用於半結構化和非結構化資料。Hadoop和RDBMS不同,一般採用分散式儲存,因此在查詢處理的時候將會面臨延遲問題。
3、資料量並不大的時候
Hadoop一般適用於多大的資料量呢?答案是:TB 或者PB。當你的資料只有幾十GB時,使用Hadoop是沒有任何好處的。按照企業的需求有選擇性的的使用Hadoop,不要盲目追隨潮流。Hadoop很強大。但企業在使用Hadoop或者大資料之前,首先要明確自己的目標,再確定是否選對了工具。
4、大量的小檔案
小檔案指的是那些size比HDFS的block size(預設64M)小得多的檔案。如果在HDFS中儲存大量的小檔案,每一個個檔案對應一個block,那麼就將要消耗namenode大量的記憶體來儲存這些block的資訊。如果小檔案規模再大一些,那麼將會超出現階段計算機硬體所能滿足的極限。
5、太多的寫入和檔案更新
HDFS是採用的一些多讀方式。當有太多檔案更新需求,Hadoop沒有辦法支援。
6、MapReduce可能不是最好的選擇
MapReduce是一個簡單的並行程式設計模型。是大資料平行計算的利器,但很多的計算任務、工作及演算法從本質上來說就是不適合使用MapReduce框架的。
如果你讓資料共享在MapReduce,你可以這樣做:
- 迭代:執行多個 MapReduce jobs ,前一個 MapReduce 的輸出結果,作為下一個 MapReduce 的輸入。
- 共享狀態資訊:但不要分享資訊在記憶體中,由於每個MapReduce的工作是在單個JVM上執行。
相關文章
- 轉-Hadoop雖強大,但不是萬能的Hadoop
- 雖然”殺傷力”極強但勒索病毒尚難引發”網路戰爭”
- .NET自定義認證雖然簡單,但好用
- Ubuntu Edge雖然夭折 但依然備受消費者期待Ubuntu
- 外媒評iPhone X:雖然價格不菲 但還是不錯iPhone
- 雖然生活成本高,但程式設計師留在矽谷很明智程式設計師
- 埃森哲:人工智慧是一種新的介面,但並不是萬能的人工智慧
- 李彥宏雖然很投入 但百度可能正在錯過人工智慧人工智慧
- 新一代Apple Watch雖然支援LTE網路 但並不能打電話APP
- 雖然Google走了,但我們還有很多Go
- 資料中臺不是企業的萬能妙藥
- 雖然AR遊戲不好做,但這款結合了LBS模式的小遊戲倒在韓國引發熱潮遊戲模式
- 本文雖然不是laravel相關的技術部落格,但是我還是放在了laravel下。與君共勉Laravel
- Windows 98 即插即用功能不是“萬能”的(轉)Windows
- 這幾個網站我喜歡,雖然不是很有名,但是操作起來絕對好用到爆!網站
- 個性化的桌面,雖然這是臺工作機。
- 15個不起眼但非常強大的 Vim 命令
- 雖然風口不再 但資料顯示移動教育上半年最受資本青睞的仍是K12
- 雖然Kubernetes可能是基礎設施的未來,但它不是開發者平臺 | devops.loldev
- 在Linux中,程式產生了庫日誌雖然刪除了,但磁碟空間未更新是什麼原因?Linux
- noip模擬29[簡單的板子題](雖然我不會)
- JSP筆記,java的伺服器頁面,雖然說要淘汰了,但沒說已經不使用了,學吧JS筆記Java伺服器
- 頑皮狗員工每天工作14小時 但這並不是被強制的
- 結構雖簡單,但效能強悍——3個小型卷積神經網路簡介卷積神經網路
- 雖然包含string標頭檔案但未用std::
- 求迴文子序列個數(雖然字串,但是DP)字串
- 雖然不相干,但也問一下,哪位高人能夠指點一下偶MYSQL的索引問題??MySql索引
- Python雖然很火,為啥找工作這麼難?Python
- 萬能碼不是普通的二維碼(安全掃碼專業委員會)
- 周鴻禕:網際網路思維不是”萬能藥”
- 介紹鮮為人知但功能強大的 Git 技術Git
- 對話準獨角獸簡道雲:低程式碼不是萬能的
- 《毀滅戰士:永恆》——時代雖變,但DOOM永恆OOM
- 雖遲但到!IJCAI 2020大會線上舉行,全部論文獎項公佈AI
- 【DBA】Oracle dba角色不是萬能的,儲存過程需要顯示授權Oracle儲存過程
- 六公司抵制流量劫持,雖有私心但依舊有利行業行業
- 23 種設計模式的通俗解釋,雖然有點汙,但是很正點設計模式
- Java不是增強的HTML(轉)JavaHTML