spark core原始碼分析2 master啟動流程

五柳-先生發表於2016-01-29

原始碼位置：org.apache.spark.deploy.master.Master.scala

一、main主方法：

[java]view
plain copy

def main(argStrings: Array[String]) {  

    SignalLogger.register(log)  

    val conf = new SparkConf  

    val args = new MasterArguments(argStrings, conf)  

    val (actorSystem, _, _, _) = startSystemAndActor(args.host, args.port, args.webUiPort, conf)  

    actorSystem.awaitTermination()  

  }

解析spark相關的環境變數及方法引數，建立akka actorSystem及ActorRef用於與其它節點的互動，訊息處理類為Master

二、Actor preStart方法

[java]view
plain copy

既然建立了akka，自然最先執行了master的preStart方法。  

override def preStart() {  

    logInfo("Starting Spark master at " + masterUrl)  

    logInfo(s"Running Spark version ${org.apache.spark.SPARK_VERSION}")  

    // Listen for remote client disconnection events, since they don't go through Akka's watch()

[java]view
plain copy

//訂閱本身akka生命週期事<span style="font-size:10px;background-color: rgb(255, 255, 255);">件，<span style="font-family: Menlo;">AssociatedEvent，</span><span style="font-family: Menlo;">DisassociatedEvent之類的事件</span></span>  

context.system.eventStream.subscribe(self, classOf[RemotingLifecycleEvent])  

webUi.bind()  

masterWebUiUrl = "http://" + masterPublicAddress + ":" + webUi.boundPort  

//這裡會啟一個定時排程，檢查timeout的worker程式。如果有worker超時，則將狀態置為DEAD，並清理一些記憶體中關於該worker的資訊。如果該worker中有Executor程式，則向driver傳送ExecutorUpdated訊息，表明該Executor也已經不可用了。如果該worker中有Driver程式，且配置driver是可以relaunch的，則重新排程在可用的worker節點上啟動，不然的話就刪除該Driver的記憶體資訊。只有在該worker超時很多次之後，才真正刪除，之前其實只是讓該worker不被選中執行任務而已。  

context.system.scheduler.schedule(0 millis, WORKER_TIMEOUT millis, self, CheckForWorkerTimeOut)  

masterMetricsSystem.registerSource(masterSource)  

masterMetricsSystem.start()  

applicationMetricsSystem.start()  

// Attach the master and app metrics servlet handler to the web ui after the metrics systems are  

// started.  

masterMetricsSystem.getServletHandlers.foreach(webUi.attachHandler)  

applicationMetricsSystem.getServletHandlers.foreach(webUi.attachHandler)  

//下面是master HA過程，下次會單獨介紹  

val (persistenceEngine_, leaderElectionAgent_) = RECOVERY_MODE match {  

  case "ZOOKEEPER" =>  

    logInfo("Persisting recovery state to ZooKeeper")  

    val zkFactory =  

      new ZooKeeperRecoveryModeFactory(conf, SerializationExtension(context.system))  

    (zkFactory.createPersistenceEngine(), zkFactory.createLeaderElectionAgent(this))  

  case "FILESYSTEM" =>  

    val fsFactory =  

      new FileSystemRecoveryModeFactory(conf, SerializationExtension(context.system))  

    (fsFactory.createPersistenceEngine(), fsFactory.createLeaderElectionAgent(this))  

  case "CUSTOM" =>  

    val clazz = Class.forName(conf.get("spark.deploy.recoveryMode.factory"))  

    val factory = clazz.getConstructor(classOf[SparkConf], classOf[Serialization])  

      .newInstance(conf, SerializationExtension(context.system))  

      .asInstanceOf[StandaloneRecoveryModeFactory]  

    (factory.createPersistenceEngine(), factory.createLeaderElectionAgent(this))  

  case _ =>  

    (new BlackHolePersistenceEngine(), new MonarchyLeaderAgent(this))  

}  

persistenceEngine = persistenceEngine_  

leaderElectionAgent = leaderElectionAgent_

至此，master主動處理的流程就完了，之後就接受其他的請求來被動處理。

三、接受worker節點的註冊

[java]view
plain copy

case RegisterWorker(id, workerHost, workerPort, cores, memory, workerUiPort, publicAddress) =>  

{  

  logInfo("Registering worker %s:%d with %d cores, %s RAM".format(  

    workerHost, workerPort, cores, Utils.megabytesToString(memory)))  

  if (state == RecoveryState.STANDBY) {  

    // ignore, don't send response  

  } else if (idToWorker.contains(id)) {  

    //如果worker id之前已經註冊過，則註冊失敗  

    sender ! RegisterWorkerFailed("Duplicate worker ID")  

  } else {  

    val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory,  

      sender, workerUiPort, publicAddress)  

    if (registerWorker(worker)) { //將worker資訊加入master記憶體中  

      persistenceEngine.addWorker(worker)  

      //向worker傳送RegisteredWorker訊息  

      sender ! RegisteredWorker(masterUrl, masterWebUiUrl)  

      schedule() //排程  

    } else {  

      val workerAddress = worker.actor.path.address  

      logWarning("Worker registration failed. Attempted to re-register worker at same " +  

        "address: " + workerAddress)  

      sender ! RegisterWorkerFailed("Attempted to re-register worker at same address: "  

        + workerAddress)  

    }  

  }  

}  

private def schedule(): Unit = {  

  if (state != RecoveryState.ALIVE) { return }  

  // Drivers take strict precedence over executors  

  val shuffledWorkers = Random.shuffle(workers) // Randomization helps balance drivers  

  //將可用的worker隨機化，並將waitingDrivers中的driver啟動  

  for (worker <- shuffledWorkers if worker.state == WorkerState.ALIVE) {  

    for (driver <- waitingDrivers) {  

      if (worker.memoryFree >= driver.desc.mem && worker.coresFree >= driver.desc.cores) {  

        launchDriver(worker, driver)//向worker傳送LaunchDriver訊息  

        waitingDrivers -= driver  

      }  

    }  

  }  

  startExecutorsOnWorkers()//見下面分析  

}  

private def startExecutorsOnWorkers(): Unit = {  

  // Right now this is a very simple FIFO scheduler. We keep trying to fit in the first app  

  // in the queue, then the second app, etc.  

  //這個spreadOutApps引數是說明將app儘可能分散在所有的worker中還是儘量分散在一部分worker中  

  if (spreadOutApps) {  

    // Try to spread out each app among all the workers, until it has all its cores  

    for (app <- waitingApps if app.coresLeft > 0) {  

      val usableWorkers = workers.toArray.filter(_.state == WorkerState.ALIVE)  

        .filter(worker => worker.memoryFree >= app.desc.memoryPerExecutorMB &&  

          worker.coresFree >= app.desc.coresPerExecutor.getOrElse(1))  

        .sortBy(_.coresFree).reverse  

      val numUsable = usableWorkers.length  

      val assigned = new Array[Int](numUsable) // Number of cores to give on each node  

      var toAssign = math.min(app.coresLeft, usableWorkers.map(_.coresFree).sum)  

      var pos = 0  

      //while中是為了將app儘可能分散在可用的worker中，在每個worker中啟動一個或者多個Executor  

      while (toAssign > 0) {  

        if (usableWorkers(pos).coresFree - assigned(pos) > 0) {  

          toAssign -= 1  

          assigned(pos) += 1  

        }  

        pos = (pos + 1) % numUsable  

      }  

      // Now that we've decided how many cores to give on each node, let's actually give them  

      for (pos <- 0 until numUsable if assigned(pos) > 0) {  

        allocateWorkerResourceToExecutors(app, assigned(pos), usableWorkers(pos))  

      }  

    }  

  } else {  

    // Pack each app into as few workers as possible until we've assigned all its cores  

    for (worker <- workers if worker.coresFree > 0 && worker.state == WorkerState.ALIVE) {  

      for (app <- waitingApps if app.coresLeft > 0) {  

        allocateWorkerResourceToExecutors(app, app.coresLeft, worker)  

      }  

    }  

  }  

}  

private def allocateWorkerResourceToExecutors(  

    app: ApplicationInfo,  

    coresToAllocate: Int,  

    worker: WorkerInfo): Unit = {  

  val memoryPerExecutor = app.desc.memoryPerExecutorMB  

  val coresPerExecutor = app.desc.coresPerExecutor.getOrElse(coresToAllocate)  

  var coresLeft = coresToAllocate  

  while (coresLeft >= coresPerExecutor && worker.memoryFree >= memoryPerExecutor) {  

    val exec = app.addExecutor(worker, coresPerExecutor)  

    coresLeft -= coresPerExecutor  

    //向worker傳送LaunchExecutor訊息，並向driver傳送ExecutorAdded訊息  

    launchExecutor(worker, exec)  

    app.state = ApplicationState.RUNNING  

  }  

}

除HA相關訊息之外，還可接收如下訊息，功能處理其實也都比較簡單，後續會結合Job的提交過程逐步分析。。

case RequestSubmitDriver(description)//請求提交Driver訊息，記錄Driver的資訊並排程

case RequestKillDriver(driverId)

case RequestDriverStatus(driverId)

case RegisterApplication(description)//提交Application，記錄Application的資訊並排程

case ExecutorStateChanged(appId, execId, state, message, exitStatus)

case DriverStateChanged(driverId, state, exception)

case Heartbeat(workerId)//心跳，用於worker節點的保活

轉載：http://blog.csdn.net/yueqian_zhu/article/details/47907095

spark core原始碼分析4 worker啟動流程
2016-01-29
Spark原始碼
spark core原始碼分析3 Master HA
2016-01-29
Spark原始碼AST
Scrapy原始碼閱讀分析_2_啟動流程
2019-02-19
原始碼
Flutter啟動流程原始碼分析
2020-04-01
Flutter原始碼
apiserver原始碼分析——啟動流程
2021-10-04
APIServer原始碼
Activity啟動流程原始碼分析
2018-03-29
原始碼
Spark job分配流程原始碼分析
2015-10-13
Spark原始碼
spark core原始碼分析1 叢集啟動及任務提交過程
2016-01-29
Spark原始碼
Tomcat原始碼分析--啟動流程
2020-10-19
Tomcat原始碼
JobTracker啟動流程原始碼級分析
2014-05-08
原始碼
Giraph原始碼分析（二）—啟動Master/Worker服務
2019-07-26
原始碼AST
Android Activity啟動流程原始碼分析
2019-02-28
Android原始碼
Android原始碼分析：Activity啟動流程
2018-03-29
Android原始碼
Giraph原始碼分析（四）—— Master 如何檢查Worker啟動
2021-09-09
原始碼AST
以太坊原始碼分析(39）geth啟動流程分析
2018-05-14
原始碼
Apache Flink原始碼分析---JobManager啟動流程
2020-09-29
Apache原始碼
Giraph原始碼分析（四）—— Master 如何檢查Worker啟動成功
2019-07-26
原始碼AST
SpringBoot2 | SpringBoot啟動流程原始碼分析（一）
2019-04-02
Spring Boot原始碼
Spark原始碼分析之Worker啟動通訊機制
2017-11-09
Spark原始碼
【原始碼解讀】asp.net core原始碼啟動流程精細解讀
2023-05-20
原始碼ASP.NET
Spark on Yarn 任務提交流程原始碼分析
2015-10-21
SparkYarn原始碼
Android系統原始碼分析–Service啟動流程
2019-02-18
Android原始碼
Sharding-JDBC 原始碼之啟動流程分析
2020-12-20
JDBC原始碼
Android系統原始碼分析--Service啟動流程
2018-04-27
Android原始碼
hadoop原始碼_hdfs啟動流程_2_DataNode
2021-07-15
Hadoop原始碼
Activiti 流程啟動及節點流轉原始碼分析
2016-04-23
原始碼
NioEventLoop啟動流程原始碼解析
2019-07-16
OOP原始碼
Android 系統原始碼-1：Android 系統啟動流程原始碼分析
2019-01-20
Android原始碼
RxJava2原始碼分析（一）：基本流程分析
2019-01-06
RxJava原始碼
聊聊Dubbo（九）：核心原始碼-服務端啟動流程2
2018-10-23
原始碼服務端
【zookeeper原始碼】啟動流程詳解
2019-03-03
原始碼
ReactNative原始碼篇：啟動流程
2017-09-28
React原始碼
Spark 原始碼分析系列
2019-07-28
Spark原始碼
Spark core篇 Rpc原始碼1
2021-09-09
SparkRPC原始碼
PackageManagerService啟動原始碼分析
2015-05-06
Package原始碼
spark 原始碼分析之二十一 -- Task的執行流程
2019-07-29
Spark原始碼
Spark3.0YarnCluster模式任務提交流程原始碼分析
2020-09-06
SparkYarn模式原始碼
SpringBoot一站式啟動流程原始碼分析
2018-06-06
Spring Boot原始碼

spark core原始碼分析2 master啟動流程

相關文章