MapReduce原理及簡單實現

星見遙發表於2021-02-21

原文網址 : https://www.cnblogs.com/weijunji/p/14427047.html

MapReduce是Google在2004年發表的論文《MapReduce: Simplified Data Processing on Large Clusters》中提出的一個用於分散式的用於大規模資料處理的程式設計模型。

原理

MapReduce將資料的處理分成了兩個步驟，Map和Reduce。Map將輸入的資料集拆分成一批KV對並輸出，對於每一個<k1, v1>，Map將輸出一批<k2, v2>；Reduce將Map對Map中產生的結果進行彙總，對於每一個<k2, list(v2)>（list(v2)是所有key為k2的value），Reduce將輸出結果<k3, v3>。

以單詞出現次數統計程式為例，map對文件中每個單詞都輸出<word, 1>，reduce則會統計每個單詞對應的list的長度，輸出<word, n>：

map(String key, String value):
 // key: document name
 // value: document contents
 for each word w in value:
   EmitIntermediate(w, “1″);

reduce(String key, Iterator values):
 // key: a word
 // values: a list of counts
 int result = 0;
 for each v in values:
   result += ParseInt(v);
 Emit(AsString(result));

流程

MapReduce的流程如下：

將輸入拆分成M個段，產生M個Map任務和R個Reduce任務。
建立1個master和n個worker，master會將Map和Reduce分派給worker執行。
被分配了Map任務的worker從輸入中讀取解析出KV對，傳遞給使用者提供的Map函式，得到中間的一批KV對。
將中間的KV對使用分割槽函式分配到R個區域上，並儲存到磁碟中，當Map任務執行完成後將儲存的位置返回給master。
Reduce worker根據master傳遞的引數從檔案系統中讀取資料，解析出KV對，並對具有相同key的value進行聚合，產生<k2, list(v2)>。如果無法在記憶體中進行排序，就需要使用外部排序。
對於每一個唯一的key，將<k2, list(v2)>傳遞給使用者提供的Reduce函式，將函式的返回值追加到輸出檔案中。
當所有任務都完成後，MapReduce程式返回

MapReduce的整個流程並不複雜，就是將資料分片後提交給map執行，執行產生的中間結果經過處理後再交給reduce執行，產生最終結果。

容錯

當worker發生故障時，可以通過心跳等方法進行檢測，當檢測到故障之後就可以將任務重新分派給其他worker重新執行。

當master發生故障時，可以通過檢查點（checkpoint）的方法來進行恢復。然而由於master只有一個，比較難進行恢復，因此可以讓使用者檢測並重新執行任務。

對於輸出檔案來說，需要保證仍在寫入中的檔案不被讀取，即保證操作的原子性。可以通過檔案系統重新命名操作的原子性來實現，先將結果儲存在臨時檔案中，當執行完成後再進行重新命名。使用這種方法就可以將有副作用的write變為冪等（總是產生相同結果的運算，如a = 2就是冪等的，而a += 2則不是）的重新命名。

落伍者

影響任務的總執行時間的重要因素就是落伍者：在運算中某個機器用了很長時間才完成了最後的幾個任務，從而增加了總的執行時間。對於這種情況，可以在任務即將完成時，將剩餘的任務交給備用者程式來執行，無論是最初的worker完成了任務還是備用者完成了，都可以將任務標記為完成。

分割槽函式

對於map產生的結果，通過分割槽函式來將相同key的KV對分配給同一個reduce來執行。預設的分割槽函式是hash(key) % R，但在某些情況下也可以選擇其他分割槽函式。如key為URL時，希望相同主機的結果在同一個輸出中，那麼就可以用hash(hostname(key)) % R作為分割槽函式。

實現

實現部分是基於MIT 6.824的實驗完成的。

type Coordinator struct {
	mapJobs      []Job
	reduceJobs   []Job
	status       int
	nMap         int
	remainMap    int
	nReduce      int
	remainReduce int
	lock         sync.Mutex
}

func MakeCoordinator(files []string, nReduce int) *Coordinator {
	c := Coordinator{}
	c.status = MAP
	c.nMap = len(files)
	c.remainMap = c.nMap
	c.nReduce = nReduce
	c.remainReduce = c.nReduce
	c.mapJobs = make([]Job, len(files))
	c.reduceJobs = make([]Job, nReduce)
	for idx, file := range files {
		c.mapJobs[idx] = Job{[]string{file}, WAITTING, idx}
	}
	for idx := range c.reduceJobs {
		c.reduceJobs[idx] = Job{[]string{}, WAITTING, idx}
	}
	c.server()
	return &c
}

func (c *Coordinator) timer(status *int) {
	time.Sleep(time.Second * 10)

	c.lock.Lock()
	if *status == RUNNING {
		log.Printf("timeout\n")
		*status = WAITTING
	}
	c.lock.Unlock()
}

func (c *Coordinator) AcquireJob(args *AcquireJobArgs, reply *AcquireJobReply) error {
	c.lock.Lock()
	defer c.lock.Unlock()
	fmt.Printf("Acquire: %+v\n", args)
	if args.CommitJob.Index >= 0 {
		if args.Status == MAP {
			if c.mapJobs[args.CommitJob.Index].Status == RUNNING {
				c.mapJobs[args.CommitJob.Index].Status = FINISHED
				for idx, file := range args.CommitJob.Files {
					c.reduceJobs[idx].Files = append(c.reduceJobs[idx].Files, file)
				}
				c.remainMap--
			}
			if c.remainMap == 0 {
				c.status = REDUCE
			}
		} else {
			if c.reduceJobs[args.CommitJob.Index].Status == RUNNING {
				c.reduceJobs[args.CommitJob.Index].Status = FINISHED
				c.remainReduce--
			}
			if c.remainReduce == 0 {
				c.status = FINISH
			}
		}
	}
	if c.status == MAP {
		for idx := range c.mapJobs {
			if c.mapJobs[idx].Status == WAITTING {
				reply.NOther = c.nReduce
				reply.Status = MAP
				reply.Job = c.mapJobs[idx]
				c.mapJobs[idx].Status = RUNNING
				go c.timer(&c.mapJobs[idx].Status)
				return nil
			}
		}
		reply.NOther = c.nReduce
		reply.Status = MAP
		reply.Job = Job{Files: make([]string, 0), Index: -1}
	} else if c.status == REDUCE {
		for idx := range c.reduceJobs {
			if c.reduceJobs[idx].Status == WAITTING {
				reply.NOther = c.nMap
				reply.Status = REDUCE
				reply.Job = c.reduceJobs[idx]
				c.reduceJobs[idx].Status = RUNNING
				go c.timer(&c.reduceJobs[idx].Status)
				return nil
			}
		}
		reply.NOther = c.nMap
		reply.Status = REDUCE
		reply.Job = Job{Files: make([]string, 0), Index: -1}
	} else {
		reply.Status = FINISH
	}
	return nil
}

在Coordinator中儲存所有的任務資訊以及執行狀態，worker通過AcquireJob來提交和申請任務，要等待所有map任務完成後才能執行reduce任務。這裡就簡單的將每一個檔案都作為一個任務。

func doMap(mapf func(string, string) []KeyValue, job *Job, nReduce int) (files []string) {
	outFiles := make([]*os.File, nReduce)
	for idx := range outFiles {
		outFile, err := ioutil.TempFile("./", "mr-tmp-*")
		if err != nil {
			log.Fatalf("create tmp file failed: %v", err)
		}
		defer outFile.Close()
		outFiles[idx] = outFile
	}
	for _, filename := range job.Files {
		file, err := os.Open(filename)
		if err != nil {
			log.Fatalf("cannot open %v", filename)
		}
		content, err := ioutil.ReadAll(file)
		if err != nil {
			log.Fatalf("cannot read %v", filename)
		}
		file.Close()
		kva := mapf(filename, string(content))
		for _, kv := range kva {
			hash := ihash(kv.Key) % nReduce
			js, _ := json.Marshal(kv)
			outFiles[hash].Write(js)
			outFiles[hash].WriteString("\n")
		}
	}
	for idx := range outFiles {
		filename := fmt.Sprintf("mr-%d-%d", job.Index, idx)
		os.Rename(outFiles[idx].Name(), filename)
		files = append(files, filename)
	}
	return
}

func doReduce(reducef func(string, []string) string, job *Job, nMap int) {
	log.Printf("Start reduce %d", job.Index)
	outFile, err := ioutil.TempFile("./", "mr-out-tmp-*")
	defer outFile.Close()
	if err != nil {
		log.Fatalf("create tmp file failed: %v", err)
	}
	m := make(map[string][]string)
	for _, filename := range job.Files {
		file, err := os.Open(filename)
		if err != nil {
			log.Fatalf("cannot open %v", filename)
		}
		scanner := bufio.NewScanner(file)
		for scanner.Scan() {
			kv := KeyValue{}
			if err := json.Unmarshal(scanner.Bytes(), &kv); err != nil {
				log.Fatalf("read kv failed: %v", err)
			}
			m[kv.Key] = append(m[kv.Key], kv.Value)
		}
		if err := scanner.Err(); err != nil {
			log.Fatal(err)
		}
		file.Close()
	}
	for key, value := range m {
		output := reducef(key, value)
		fmt.Fprintf(outFile, "%v %v\n", key, output)
	}
	os.Rename(outFile.Name(), fmt.Sprintf("mr-out-%d", job.Index))
	log.Printf("End reduce %d", job.Index)
}

//
// main/mrworker.go calls this function.
//
func Worker(mapf func(string, string) []KeyValue,
	reducef func(string, []string) string) {
	CallExample()
	var status int = MAP
	args := AcquireJobArgs{Job{Index: -1}, MAP}
	for {
		args.Status = status
		reply := AcquireJobReply{}
		call("Coordinator.AcquireJob", &args, &reply)
		fmt.Printf("AcReply: %+v\n", reply)
		if reply.Status == FINISH {
			break
		}
		status = reply.Status
		if reply.Job.Index >= 0 {
			// get a job, do it
			commitJob := reply.Job
			if status == MAP {
				commitJob.Files = doMap(mapf, &reply.Job, reply.NOther)
			} else {
				doReduce(reducef, &reply.Job, reply.NOther)
				commitJob.Files = make([]string, 0)
			}
			// job finished
			args = AcquireJobArgs{commitJob, status}
		} else {
			// no job, sleep to wait
			time.Sleep(time.Second)
			args = AcquireJobArgs{Job{Index: -1}, status}
		}
	}
}

worker通過RPC呼叫向Coordinator.AcquireJob申請和提交任務，之後根據任務型別執行doMap或doReduce。

doMap函式讀取目標檔案並將<filename, content>傳遞給map函式，之後將返回值根據hash(key) % R寫入到目標中間檔案中去。

doReduce函式則從目標檔案中讀取KV對並載入到記憶體中，對相同的key進行合併（這裡我是用map來做的，但是之後看論文發現是用排序來做的，這樣可以保證在每個輸出檔案中的key是有序的）。合併之後就將<key, list(value)>交給reduce函式處理，最後把返回值寫入到結果檔案中去。

vue 實現原理及簡單示例實現
2020-09-11
Vue
async/await 原理及簡單實現
2019-05-08
AI
【Tomcat】Tomcat工作原理及簡單模擬實現
2019-03-15
Tomcat
簡單實現vuex原理
2018-10-25
Vue
js拖拽原理及簡單實現(渣渣自學)
2020-09-10
JS
簡單的實現vue原理
2018-10-25
Vue
簡單的實現React原理
2018-10-25
React
Redux 原理和簡單實現
2021-05-28
Redux
防抖原理以及簡單實現
2019-10-09
簡單、好懂的Svelte實現原理
2021-11-12
簡單介紹numpy實現RNN原理實現
2021-04-12
RNN
單頁面路由原理及實現
2018-08-27
路由
Java NIO原理及簡單拷貝實列
2019-04-19
Java
virtual-dom原理與簡單實現
2019-03-04
Promise的使用及簡單實現
2018-05-29
Promise
簡單理解async、await語法實現原理
2018-10-01
AI
視覺單目測距原理及實現
2024-03-14
視覺
Vue2原始碼解讀（4） - 響應式原理及簡單實現
2021-10-24
Vue原始碼
微前端調研及簡析SPA實現原理
2020-06-01
前端
AOP如何實現及實現原理
2018-11-23
Unity Shader- UV動畫原理及簡易實現
2022-05-21
Unity動畫
Java 實現《編譯原理》簡單詞法分析功能
2019-06-13
Java編譯原理詞法分析
Python-split()函式用法及簡單實現
2021-09-11
Python函式
簡述RPC原理實現
2018-10-10
RPC
SpringMVC實現原理及解析
2018-10-28
SpringMVC
KVO使用及實現原理
2019-01-11
Promise原理探究及實現
2019-07-18
Promise
NNLM原理及Pytorch實現
2021-05-03
PyTorch
基於Netty的Android系統IM簡單實現原理
2021-09-09
NettyAndroid
簡單工廠模式(simple factory)及程式碼實現
2020-10-25
模式
SSM專案搭建及實現簡單的登入
2020-11-08
SSM
基於Python實現MapReduce
2024-05-14
Python
Promise 簡單實現
2019-02-26
Promise
ReadableStream 簡單實現
2018-07-13
Express 簡單實現
2018-07-13
Express
AspectJ簡單實現
2020-10-10
FastClick簡單實現
2021-04-02
AST
CRC校驗原理簡介及C程式碼實現說明
2021-06-03
C程式

MapReduce原理及簡單實現

原理

流程

容錯

落伍者

分割槽函式

實現

相關文章