Hadoop叢集三種作業排程演算法介紹

jiaaq2008發表於2014-04-03

Hadoop叢集中有三種作業排程演算法，分別為FIFO，公平排程演算法和計算能力排程演算法
先來先服務（FIFO）
Hadoop中預設的排程器FIFO，它先按照作業的優先順序高低，再按照到達時間的先後選擇被執行的作業。
FIFO比較簡單，hadoop中只有一個作業佇列，被提交的作業按照先後順序在作業佇列中排隊，新來的作業插入到隊尾。一個作業執行完後，總是從隊首取下一個作業執行。這種排程策略的優點是簡單、易於實現，同時也減輕了jobtracker的負擔。但是它的缺點也是顯然的，它對所有的作業都一視同仁，沒有考慮到作業的緊迫程度，另外對小作業的執行不利。
公平排程策略
這種策略在系統中配置了任務槽，一個任務槽可以執行一個task任務，這些任務就是一個大的作業被切分後的小作業。當一個使用者提交多個作業時，每個作業可以分配到一定的任務槽以執行task任務（這裡的任務槽可以理解為可以執行一個map任務或reduce任務）。如果把整個hadoop叢集作業排程跟作業系統的作業排程相比，第一種FIFO就相當於作業系統中早期的單道批處理系統，系統中每個時刻只有一道作業在執行，而公平排程相當於多道批處理系統，它實現了同一個時刻多道作業同時執行。由於linux是多使用者的，若有多個使用者同時提交多個作業會怎樣？在這種策略中給每個使用者分配一個作業池，然後給每個作業池設定一個最小共享槽個數，什麼是最小共享槽個數呢？先要理解一個最小什麼意思，最小是指只要這個作業池需要，排程器應該確保能夠滿足這個作業池的最小任務槽數的需求，但是如何才能確保在它需要的時候就有空的任務槽，一種方法是固定分配一定數量的槽給作業池不動，這個數量至少是最小任務槽值，這樣只要在作業池需要的時候就分配給它就行了，但是這樣在這個作業池沒有用到這麼多工槽的時候會造成浪費，這種策略實際上是這樣做的，當作業池的需求沒有達到最小任務槽數時，名義上是自己的剩餘的任務槽會被分給其他有需要的作業池，當一個作業池需要申請任務槽的時候若系統中沒有了，這時候不會去搶佔別人的（也不知道搶誰的啊），只要當前一個空的任務槽釋放會被立即分配給這個作業池。
在一個使用者的作業池內，多個作業如何分配槽這個可以自行選擇瞭如FIFO。所以這種排程策略分為兩級：
第一級，在池間分配槽，在多使用者的情況下，每個使用者分配一個作業池。
第二級，在作業池內，每個使用者可以使用不同的排程策略。
計算能力排程
計算能力排程和公平排程有點類似，公平排程策略是以作業池為單位分配任務槽，而計算能力排程是以佇列為單位分配tasktracker（叢集中一個節點），這種排程策略配置了多個佇列，每個佇列配置了最小額度的tasktracker數量，同公平排程策略類似，當一個佇列有空閒的tasktracker時，排程器會將空閒的分配給其他的佇列，當有空閒的tasktracker時，由於這時候可能有多個佇列沒有得到最小額度的tasktracker而又在申請新的，空閒的tasktracker會被優先分配到最飢餓的佇列中去，如何衡量飢餓程度呢？可以通過計算佇列中正在執行的任務數與其分得的計算資源之間的比值是否最低來判斷的，越低說明飢餓程度越高。
計算能力排程策略是以佇列的方式組織作業的，所以一個使用者的作業可能在多個佇列中，如果不對使用者做一定的限制，很可能出現在多個使用者之間出現嚴重不公平的現象。所以在選中新作業執行時候，還需要考慮作業所屬的使用者是否超過了資源的限制，如果超過，作業不會被選中。
對於在同一個佇列中，這種策略使用的是基於優先順序的FIFO策略，但是不會搶佔。

磁軌排程演算法介紹
2018-09-15
演算法
分散式後臺作業排程器JobRunr介紹 - JAXenter
2022-03-01
分散式
Apache Oozie 教程：使用 Oozie 排程 Hadoop 作業
2021-12-30
ApacheHadoop
面試官：介紹一下 Redis 三種叢集模式
2022-11-28
面試Redis模式
作業系統之排程演算法
2020-12-28
作業系統演算法
ClickHouse 邏輯叢集介紹
2022-05-03
Redis 漸進叢集介紹
2022-07-12
Redis
k8s排程器介紹（排程框架版本）
2021-10-15
K8S框架
Hadoop叢集中Hbase的介紹、安裝、使用
2022-12-20
Hadoop
Redis三種叢集模式
2022-03-16
Redis模式
【作業系統】磁碟的四種基本排程演算法（圖表說明）
2020-11-18
作業系統演算法
【作業系統】4.程序排程演算法
2024-11-10
作業系統演算法
Hadoop搭建叢集
2018-06-26
Hadoop
Hadoop叢集搭建
2023-02-21
Hadoop
Kubernetes叢集排程器原理剖析及思考
2019-04-01
kubernetes叢集內排程與負載均衡
2020-11-21
負載
從零開始入門 K8s | 排程器的排程流程和演算法介紹
2020-01-08
K8S演算法
LVS - 相關介紹、工作模式和排程演算法的說明
2018-05-17
模式演算法
Redis叢集介紹及測試思路
2023-04-07
Redis
4.4 Hadoop叢集搭建
2018-11-15
Hadoop
Hadoop叢集搭建（一）
2020-10-02
Hadoop
Hadoop Hive介紹
2018-07-11
HadoopHive
Hadoop Sqoop介紹
2018-08-27
Hadoop
CNCF 沙箱專案 OCM Placement 多叢集排程指南
2022-02-22
solr叢集構建的基本流程介紹
2018-03-09
Solr
VictoriaMetrics 中文教程（10）叢集版介紹
2024-10-29
第76篇 Redis叢集詳細介紹
2024-12-08
Redis
使用docker部署hadoop叢集
2020-09-04
DockerHadoop
Hadoop叢集面試題
2021-12-23
Hadoop面試題
Hadoop-叢集執行
2022-04-04
Hadoop
hadoop分散式叢集搭建
2021-03-04
Hadoop分散式
Oracle的三種高可用叢集方案
2018-07-03
Oracle
Spring Boot Quartz 分散式叢集任務排程實現
2019-06-21
Spring Bootquartz分散式
美團叢集排程系統的雲原生實踐
2022-02-22
三千字介紹Redis主從+哨兵+叢集
2021-09-30
Redis
Etcd叢集的介紹和選主應用
2022-12-06
MongoDB三種聚合命令用法介紹
2018-07-19
MongoDB
oracle排程程式作業dbms_scheduler
2018-08-20
Oracle
oracle使用DBMS_SCHEDULER排程作業
2018-08-20
Oracle

Hadoop叢集三種作業排程演算法介紹

相關文章