分散式計算與Map Reduce
一、分散式計算
1、定義:一個分散式計算系統是通過若干個網路互連的計算機組成的軟硬體計算系統,並且這些計算機互相配合完成一個共同任務。
多個處理器共享記憶體(c);每個處理器有屬於自己的記憶體(b)。
優點:可擴充套件、效能好、容錯性好(系統故障後,仍然可以恢復任務)
缺點:多臺機器管理
二、Map Reduce
1.抽象架構
2.系統架構
Job Client:使用者編寫的Map Reduce程式通過JobClient提交給JobTracker
Job Tracker:負責資源監控和作業排程,並且監控所有TaskTracker與作業的健康情況,一旦有失敗情況發生,就會在相應的任務分配到其他節點上去執行。
Task Tracker:主要負責監控任務進度,並且彙報給Job Tracker.
3.工作排程原理
Map Reducer Application Master:負責分配任務,協調Mapper和Reducer進行執行
Mapper Worker:負責執行 Mapper子任務
Reducer Worker:負責Reduce函式功能,負責彙總Reducer子任務
4.資料處理流程
5.shuffling
相關文章
- python內建函式 map/reducePython函式
- JavaScript(1)高階函式filter、map、reduceJavaScript函式Filter
- javascript高階函式---filter---map---reduceJavaScript函式Filter
- Swift集合函式:Reduce、Map、FlatMap、FilterSwift函式Filter
- Python 中的map、reduce函式用法Python函式
- 分散式雲端計算分散式
- python之高階函式map,reduce,filter用法Python函式Filter
- 理解Swift高階函式之map, filter, reduceSwift函式Filter
- [分散式]分散式計算系統淺析分散式
- Hadoop 分散式儲存分散式計算Hadoop分散式
- 五、GO程式設計模式:MAP-REDUCEGo程式設計設計模式
- GO程式設計模式05:MAP-REDUCEGo程式設計設計模式
- 我對分散式計算框架的理解與設計分散式框架
- map/reduce實現 排序排序
- 【Hadoop】按照map-reduce的思想試述完整的pagerank計算過程Hadoop
- 【分散式計算】分散式日誌匯入工具-Flume分散式
- Hadoop Map Reduce 漫談Hadoop
- 【分散式計算】DFS && BigTable分散式
- 分散式計算如果學習分散式
- Python函數語言程式設計-map/reducePython函數程式設計
- Hadoop--map/reduce實現單詞計數Hadoop
- 雲端計算分散式平行計算:系統架構分散式架構
- 淺談分散式計算的開發與實現(一)分散式
- 淺談分散式計算的開發與實現(1)分散式
- 高效能分散式計算與儲存系統設計概要分散式
- python常用函式進階(2)之map,filter,reduce,zipPython函式Filter
- [PY3]——對iterator的處理(解析式、map、reduce、filter)Filter
- python基礎 python內建函式map/reduce/filterPython函式Filter
- 雲端計算,網格計算,分散式計算,叢集計算的區別?分散式
- 分散式計算,核心知識點分散式
- 【轉】分散式計算的謬論分散式
- Python map, reduce, filter和sortedPythonFilter
- Mongodb 的中資料統計神器Map_Reduce的使用MongoDB
- Python 擴充之特殊函式(lambda 函式,map 函式,filter 函式,reduce 函式)Python函式Filter
- ray-分散式計算框架-叢集與非同步Job管理分散式框架非同步
- HazelCast分散式Map介紹和分析AST分散式
- Map-Reduce資料分析之二
- map、reduce、filter、for...of、for...in等總結Filter