Spark實時計算的開發平臺RCS——阿里流式分析實戰

OReillyData發表於2016-07-15

640?wx_fmt=jpeg

Spark開發者會將自己的程式碼完成開發並提交到yarn叢集,之後任務的監控、報警、效能優化等都依賴於開發者本身;為spark開發者提供一套可以完成任務提交、資料接入、任務監控、任務報警、錯誤日誌檢視的一體化實時計算的開發平臺realtime computing service。通過平臺可以:

1. 自助本地提交任務;jar包版本維護在hdfs上

2. 資料接入覆蓋主流中介軟體:kafka、metaq、tt和sls

3. 任務的監控、報警、日誌處理

4. spark任務容災

5. spark叢集容災

朱金清(穆公) 阿里巴巴高階資料專家,目前在阿里從事infrastructure資料的分析和開發工作,專注於spark的實時計算分析;最早加入阿里在淘寶/阿里資料庫技術團隊從事MySQL/HBase資料庫的管理和資料開發. 他將在大會上分享這一演講議題。

長按二維碼識別關注

640?wx_fmt=jpeg
閱讀原文( read more ) 瀏覽更多演講議題

相關文章