mapreduce的一般執行步驟
map任務處理過程
第一:讀取HDFS中的檔案內容,對輸入的每一行解析成<k1,v1>鍵值對, 每一對鍵值對呼叫一次map函式
第二:寫自己的邏輯map函式,對輸入的<k1,v1>處理,裝換成新的<k2,v2> 鍵值對輸出
第三:對輸出的<k2,v2>進行分割槽
第四:對不同分割槽的資料,按照key進行排序和分組,分組時把相同的key 的value放到一個集合中
第五:(可選)分組後進行資料的歸約處理
reduce任務處理
第一:對多個map任務的輸出,按照不同的分割槽,通過網路copy到不同的 reduce節點
第二:對多個map任務的輸出進行合併,排序。寫自己的reduce函式邏輯, 對輸入的key,value處理,並轉換成新的key,value輸出
第三:把reduce的輸出保持到本地磁碟中
相關文章
- make工作時的執行步驟
- 表連線的執行步驟
- RequisitPro管理需求的一般步驟UI
- 執行計劃執行步驟原則
- 全庫匯入的一般步驟
- iview-admin執行步驟View
- mysqldump執行流程步驟介紹MySql
- Oracle SQL語句執行步驟OracleSQL
- 專案執行落地的6個步驟
- Logminer的使用,具體執行步驟
- sql最佳化一般步驟SQL
- MapReduce執行流程
- MapReduce的執行流程概述
- 學習C#的一般性步驟C#
- Linux下安裝Oracle的一般步驟LinuxOracle
- 一般安裝EBS 後的 操作步驟,徵集!
- Hint 組合執行步驟 - 分開執行, 互不影響
- MapReduce程式執行流程
- 如何制定可執行的seo最佳化步驟
- 初學者執行jdonframework應用系統的步驟Framework
- SQL隱碼攻擊的原理及一般步驟SQL
- Spring整合Mybatis的一般步驟(IDEA版)SpringMyBatisIdea
- unix下編寫socket程式的一般步驟(轉)
- 如何同時尋找元素 A 和元素 B,A 先出現就執行步驟 A,B 先出現就執行步驟 B
- hadoop的mapreduce串聯執行Hadoop
- 使用MapReduce執行WordCount案例
- 部署SD-WAN之前要執行的三個步驟
- Ubuntu (14.04)下執行 DotNet Core 步驟Ubuntu
- 開源專案匯入eclipse的一般步驟Eclipse
- 網路入侵方法與一般步驟 1 (轉)
- 網路入侵方法與一般步驟2 (轉)
- 網路入侵方法與一般步驟3 (轉)
- Mapreduce(二):MR的執行過程分析
- 詳解資料分析的一般步驟及業務分析方法
- MapReduce 執行全過程解析
- 2、編寫/修改許可權及執行Shell程式的步驟
- ubuntu正確設定網路的的步驟(一般性方法)Ubuntu
- XtraBackup 搭建從庫的一般步驟及 XtraBackup 8.0 的注意事項