如下,是 spark 原始碼分析系列的一些文章彙總,持續更新中......
Spark RPC
spark 原始碼分析之五--Spark RPC剖析之建立NettyRpcEnv
spark 原始碼分析之六--Spark RPC剖析之Dispatcher和Inbox、Outbox剖析
spark 原始碼分析之七--Spark RPC剖析之RpcEndPoint和RpcEndPointRef剖析
spark 原始碼分析之八--Spark RPC剖析之TransportContext和TransportClientFactory剖析
spark 原始碼分析之九--Spark RPC剖析之StreamManager和RpcHandler
spark 原始碼分析之十一--Spark RPC剖析之TransportClient、TransportServer剖析
spark 原始碼分析之十二--Spark RPC剖析之Spark RPC總結
Spark 儲存
spark 原始碼分析之十三 -- SerializerManager剖析
spark 原始碼分析之十四 -- broadcast 是如何實現的?
spark 原始碼分析之十五 -- Spark記憶體管理剖析
spark 原始碼分析之十六 -- Spark記憶體儲存剖析
Spark Streaming
spark streaming 接收kafka訊息之一 -- 兩種接收方式
spark streaming 接收kafka訊息之二 -- 執行在driver端的receiver
spark streaming 接收kafka訊息之三 -- kafka broker 如何處理 fetch 請求
spark streaming 接收kafka訊息之四 -- 執行在 worker 上的 receiver
spark streaming 接收kafka訊息之五 -- spark streaming 和 kafka 的對接總結
Spark 任務排程與計算
spark 原始碼分析之二 -- SparkContext 的初始化過程
spark 原始碼分析之三 -- LiveListenerBus介紹
spark 原始碼分析之四 -- TaskScheduler的建立和啟動過程
spark 原始碼分析之十九 -- DAG的生成和Stage的劃分