Hadoop叢集中有三種作業排程演算法,分別為FIFO,公平排程演算法和計算能力排程演算法
先來先服務(FIFO)
Hadoop中預設的排程器FIFO,它先按照作業的優先順序高低,再按照到達時間的先後選擇被執行的作業。
FIFO比較簡單,hadoop中只有一個作業佇列,被提交的作業按照先後順序在作業佇列中排隊,新來的作業插入到隊尾。一個作業執行完後,總是從隊首取下一個作業執行。這種排程策略的優點是簡單、易於實現,同時也減輕了jobtracker的負擔。但是它的缺點也是顯然的,它對所有的作業都一視同仁,沒有考慮到作業的緊迫程度,另外對小作業的執行不利。
公平排程策略
這種策略在系統中配置了任務槽,一個任務槽可以執行一個task任務,這些任務就是一個大的作業被切分後的小作業。當一個使用者提交多個作業時,每個作業可以分配到一定的任務槽以執行task任務(這裡的任務槽可以理解為可以執行一個map任務或reduce任務)。如果把整個hadoop叢集作業排程跟作業系統的作業排程相比,第一種FIFO就相當於作業系統中早期的單道批處理系統,系統中每個時刻只有一道作業在執行,而公平排程相當於多道批處理系統,它實現了同一個時刻多道作業同時執行。由於linux是多使用者的,若有多個使用者同時提交多個作業會怎樣?在這種策略中給每個使用者分配一個作業池,然後給每個作業池設定一個最小共享槽個數,什麼是最小共享槽個數呢?先要理解一個最小什麼意思,最小是指只要這個作業池需要,排程器應該確保能夠滿足這個作業池的最小任務槽數的需求,但是如何才能確保在它需要的時候就有空的任務槽,一種方法是固定分配一定數量的槽給作業池不動,這個數量至少是最小任務槽值,這樣只要在作業池需要的時候就分配給它就行了,但是這樣在這個作業池沒有用到這麼多工槽的時候會造成浪費,這種策略實際上是這樣做的,當作業池的需求沒有達到最小任務槽數時,名義上是自己的剩餘的任務槽會被分給其他有需要的作業池,當一個作業池需要申請任務槽的時候若系統中沒有了,這時候不會去搶佔別人的(也不知道搶誰的啊),只要當前一個空的任務槽釋放會被立即分配給這個作業池。
在一個使用者的作業池內,多個作業如何分配槽這個可以自行選擇瞭如FIFO。所以這種排程策略分為兩級:
第一級,在池間分配槽,在多使用者的情況下,每個使用者分配一個作業池。
第二級,在作業池內,每個使用者可以使用不同的排程策略。
計算能力排程
計算能力排程和公平排程有點類似,公平排程策略是以作業池為單位分配任務槽,而計算能力排程是以佇列為單位分配tasktracker(叢集中一個節點),這種排程策略配置了多個佇列,每個佇列配置了最小額度的tasktracker數量,同公平排程策略類似,當一個佇列有空閒的tasktracker時,排程器會將空閒的分配給其他的佇列,當有空閒的tasktracker時,由於這時候可能有多個佇列沒有得到最小額度的tasktracker而又在申請新的,空閒的tasktracker會被優先分配到最飢餓的佇列中去,如何衡量飢餓程度呢?可以通過計算佇列中正在執行的任務數與其分得的計算資源之間的比值是否最低來判斷的,越低說明飢餓程度越高。
計算能力排程策略是以佇列的方式組織作業的,所以一個使用者的作業可能在多個佇列中,如果不對使用者做一定的限制,很可能出現在多個使用者之間出現嚴重不公平的現象。所以在選中新作業執行時候,還需要考慮作業所屬的使用者是否超過了資源的限制,如果超過,作業不會被選中。
對於在同一個佇列中,這種策略使用的是基於優先順序的FIFO策略,但是不會搶佔。
Hadoop叢集三種作業排程演算法介紹
相關文章
- Hadoop作業的三種排程演算法Hadoop演算法
- Hadoop - Azkaban 作業排程Hadoop
- Hadoop作業排程機制Hadoop
- Net作業排程(四)—quartz.net持久化和叢集quartz持久化
- 面試官:介紹一下 Redis 三種叢集模式面試Redis模式
- 分散式後臺作業排程器JobRunr介紹 - JAXenter分散式
- 磁軌排程演算法介紹演算法
- Apache Oozie 教程:使用 Oozie 排程 Hadoop 作業ApacheHadoop
- 作業系統排程演算法作業系統演算法
- 作業系統之排程演算法作業系統演算法
- Net作業排程(三) — Quartz.Net進階quartz
- Redis 漸進叢集介紹Redis
- MySQL叢集 NDB 7.5介紹MySql
- Redis三種叢集模式Redis模式
- 【作業系統】4.程序排程演算法作業系統演算法
- 【作業系統】磁碟的四種基本排程演算法(圖表說明)作業系統演算法
- k8s排程器介紹(排程框架版本)K8S框架
- 作業系統常用的排程演算法總結作業系統演算法
- 作業排程模擬程式
- 介紹三種檢視MySQL字符集的方法MySql
- 基於OGG的Oracle與Hadoop叢集準實時同步介紹OracleHadoop
- Crontab定時任務排程介紹
- 叢集排程框架的架構演進之路框架架構
- Redis叢集方案怎麼做?大牛給你介紹五種方案!Redis
- 從零開始入門 K8s | 排程器的排程流程和演算法介紹K8S演算法
- Hadoop叢集中Hbase的介紹、安裝、使用Hadoop
- Redis叢集介紹及測試思路Redis
- Redis 3.0介紹及叢集說明Redis
- hadoop叢集篇--從0到1搭建hadoop叢集Hadoop
- 作業系統(Linux)--按優先數排程演算法實現處理器排程作業系統Linux演算法
- Hadoop叢集搭建Hadoop
- Hadoop搭建叢集Hadoop
- Hadoop 叢集命令Hadoop
- FreeBSD下安裝配置Hadoop叢集(三)Hadoop
- Kubernetes叢集排程器原理剖析及思考
- kubernetes叢集內排程與負載均衡負載
- 美團叢集排程系統的雲原生實踐
- CNCF 沙箱專案 OCM Placement 多叢集排程指南