【眼前一亮!】看Hadoop底層演算法如何優雅的將大規模叢集效能提升10倍以上?

石杉的架構筆記發表於2018-11-22

歡迎關注個人公眾號:石杉的架構筆記(ID:shishan100)

週一至週五早8點半!精品技術文章準時送上!


目錄

一、前情概要

二、背景引入

三、問題凸現

四、Hadoop的優化方案


一、前情概要

這篇文章給大家聊聊Hadoop在部署了大規模的叢集場景下,大量客戶端併發寫資料的時候,檔案契約監控演算法的效能優化。看懂這篇文章需要一些Hadoop的基礎知識背景,還不太瞭解的兄弟,可以先看看之前的文章:兄弟,用大白話告訴你小白都能看懂的Hadoop架構原理。


二、背景引入

先給大家引入一個小的背景,假如多個客戶端同時要併發的寫Hadoop HDFS上的一個檔案,大家覺得這個事兒能成嗎?

明顯不可以接受啊,兄弟們,HDFS上的檔案是不允許併發寫的,比如併發的追加一些資料什麼的。所以說,HDFS裡有一個機制,叫做檔案契約機制

也就是說,同一時間只能有一個客戶端獲取NameNode上面一個檔案的契約,然後才可以寫入資料。此時如果其他客戶端嘗試獲取檔案契約的時候,就獲取不到,只能乾等著。通過這個機制,就可以保證同一時間只有一個客戶端在寫一個檔案。

在獲取到了檔案契約之後,在寫檔案的過程期間,那個客戶端需要開啟一個執行緒,不停的傳送請求給NameNode進行檔案續約,告訴NameNode:大哥,我還在寫檔案啊,你給我一直保留那個契約好嗎?而NameNode內部有一個專門的後臺執行緒,負責監控各個契約的續約時間。如果某個契約很長時間沒續約了,此時就自動過期掉這個契約,讓別的客戶端來寫。

說了這麼多,老規矩,給大家來一張圖,直觀的感受一下整個過程。

【眼前一亮!】看Hadoop底層演算法如何優雅的將大規模叢集效能提升10倍以上?


三、問題凸現

好,那麼現在問題來了,假如我們有一個大規模部署的Hadoop叢集,同時存在的客戶端可能多達成千上萬個。此時NameNode內部維護的那個檔案契約列表會非常非常的大,而監控契約的後臺執行緒又需要頻繁的每隔一段時間就檢查一下所有的契約是否過期。

比如,每隔幾秒鐘就遍歷大量的契約,那麼勢必造成效能不佳,所以說這種契約監控機制明顯是不適合大規模部署的hadoop叢集的。


四、Hadoop的優化方案

那麼Hadoop是如何對檔案契約監控演算法進行優化的呢?我們們來一步一步的看一下他的實現邏輯。首先,我們一起來看看下面這張手繪圖:

【眼前一亮!】看Hadoop底層演算法如何優雅的將大規模叢集效能提升10倍以上?

其實奧祕十分的簡單,每次一個客戶端傳送續約請求之後,就設定這個契約的最近一次續約時間。然後,基於一個TreeSet資料結構來根據最近一次續約時間對契約進行排序,每次都把續約時間最老的契約排在最前頭,這個排序後的契約資料結構十分的重要。

TreeSet是一種可排序的資料結構,他底層基於TreeMap來實現。TreeMap底層則基於紅黑樹來實現,可以保證元素沒有重複,同時還能按照我們自己定義的排序規則在你每次插入一個元素的時候來進行自定義的排序。所以這裡我們的排序規則:就是按照契約的最近一次續約時間來排序。

其實這個優化就是如此的簡單,就是維護這麼一個排序資料結構而已。我們現在來看一下Hadoop中的契約監控的原始碼實現:

【眼前一亮!】看Hadoop底層演算法如何優雅的將大規模叢集效能提升10倍以上?

每次檢查契約是否過期的時候,你不要遍歷成千上萬的契約,那樣遍歷效率當然會很低下。我們完全可以就從TreeSet中獲取續約時間最老的那個契約,假如說連最近一次續約時間最老的那個契約都還沒過期,那麼就不用繼續檢查了啊!這說明續約時間更近的那些契約絕對不會過期!

舉個例子:續約時間最老的那個契約,最近一次續約的時間是10分鐘以前,但是我們判斷契約過期的限制是超過15分鐘不續約就過期那個契約。這個時候,連10分鐘以前續約的契約都沒有過期,那麼那些8分鐘以前,5分鐘以前續約的契約,肯定也不會過期啊!

這個機制的優化對效能的提升是相當有幫助的,因為正常來說,過期的契約肯定還是佔少數,所以壓根兒不用每次都遍歷所有的契約來檢查是否過期。我們只需要檢查續約時間最舊的那幾個契約就可以了,如果一個契約過期了,那麼就刪掉那個契約,然後再檢查第二舊的契約好了。以此類推。

通過這個TreeSet排序 + 優先檢查最舊契約的機制,有效的將大規模叢集下的契約監控機制的效能提升至少10倍以上,這種思想是非常值得我們學習和借鑑的。

給大家稍微引申一下,在Spring Cloud微服務架構中,Eureka作為註冊中心其實也有續約檢查的機制,跟Hadoop是類似的(如果想了解Eureka註冊中心相關技術的朋友,建議看一下:《拜託!面試請不要再問我Spring Cloud底層原理!》)。但是在Eureka中就沒有實現類似的續約優化機制,而是暴力的每一輪都遍歷所有的服務例項的續約時間。

如果你面對的是一個大規模部署的微服務系統呢,情況就不妙了!

部署了幾十萬臺機器的大規模系統,有幾十萬個服務例項的續約資訊駐留在Eureka的記憶體中,難道每隔幾秒鐘都要遍歷幾十萬個服務例項的續約資訊嗎?

最後給大家提一句,優秀的開源專案,蘊含著很多優秀的設計思想。多看各種優秀開源專案的原始碼,是短時間內快速、大幅度提升一個人的技術功底和技術水平的方式,大家不妨嘗試一下。

END



如有收穫,請幫忙轉發,您的鼓勵是作者最大的動力,謝謝!

一大波微服務、分散式、高併發、高可用原創系列

文章正在路上,歡迎掃描下方二維碼,持續關注:

【眼前一亮!】看Hadoop底層演算法如何優雅的將大規模叢集效能提升10倍以上?

石杉的架構筆記(id:shishan100)

十餘年BAT架構經驗傾囊相授


推薦閱讀:

1、拜託!面試請不要再問我Spring Cloud底層原理

2、【雙11狂歡的背後】微服務註冊中心如何承載大型系統的千萬級訪問?

3、【效能優化之道】每秒上萬併發下的Spring Cloud引數優化實戰

4、微服務架構如何保障雙11狂歡下的99.99%高可用

5、兄弟,用大白話告訴你小白都能聽懂的Hadoop架構原理

6、大規模叢集下Hadoop NameNode如何承載每秒上千次的高併發訪問

7、【效能優化的祕密】Hadoop如何將TB級大檔案的上傳效能優化上百倍

8、拜託,面試請不要再問我TCC分散式事務的實現原理坑爹呀!

9、【坑爹呀!】最終一致性分散式事務如何保障實際生產中99.99%高可用?

10、拜託,面試請不要再問我Redis分散式鎖的實現原理!





相關文章