騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力

dicksonjyl560101發表於2019-08-26

還記得騰訊AI開源專案Angel嗎?

沒錯,也是騰訊第一個開源的AI專案。目前在GitHub上Star數已超過4200,Fork數超過1000。

剛剛釋出了3.0版本更新,功能覆蓋機器學習各個階段,開始展現全棧潛力和雄心。

具體詳細我們往下看。


騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力


全棧機器學習開源模型

Angel 3.0功能特性涵蓋了機器學習的各個階段:特徵工程,模型訓練,超引數調節和模型服務。

其中,特徵工程模組基於Spark開發,增強了Spark的特徵選擇功能,同時使用特徵交叉和重索引,實現了自動特徵生成。

這些元件可以無縫地整合進Spark的流水線。


騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力


為了讓整個系統更加的智慧,Angel 3.0還新增了超引數調節的功能,目前支援3種演算法:隨機搜尋,網格搜尋和貝葉斯最佳化。

在模型服務方面,Angel 3.0提供了一個跨平臺的元件Angel Serving, 可以為其他平臺提供模型服務。

在生態方面,Angel也嘗試將引數伺服器(PS)能力賦能給其他的計算平臺,目前已經完成了Spark On Angel和PyTorch On Angel兩個平臺的建設。

這兩個平臺各有優勢和側重, Spark On Angel使用的是Angel內建的演算法核心,主要負責常見推薦領域的機器學習演算法和基礎圖演算法。

PyTorch On Angel使用PyTorch作為計算核心,主要負責推薦領域深度學習演算法和圖深度學習演算法。


騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力


騰訊開源誠意之作

Angel是基於引數伺服器架構的分散式計算平臺,致力於解決稀疏資料大模型訓練以及大規模圖資料分析問題,它由騰訊與北京大學聯合研發,兼顧了工業界的高可用性和學術界的創新性。

自2016年年初在騰訊內部上線以來,Angel 已應用於微信支付、QQ、騰訊影片、騰訊社交廣告及使用者畫像挖掘等業務。


騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力


2017 年 6 月, Angel在 Github 上低調開源。

2018年9月,Angel 2.0版本釋出,支援千億級模型維度訓練,同時演算法庫也更加豐富,首次引入了深度學習演算法和圖演算法。

同年,Angel加入Linux旗下深度學習基金會(現已更名為 LF AI 基金會(LF AI Foundation)),結合基金會成熟的運營,全面升級的Angel 2.0與國際開源社群繼續深入互動,致力於讓機器學習技術更易於上手研究及應用落地的目標。

截至目前,Angel在GitHub上Star數已超過4200,Fork數超過1000。Angel專案目前總共有38位程式碼貢獻者,其他包括8位committer,他們總共提交了超過2000個commit。

而騰訊開源在GitHub上整體的專案數也已突破80個,涵蓋AI、雲端計算、安全等多個領域,累計獲得了超過23萬Star。

從1.0到3.0,Angel從一個單一的模型訓練平臺發展到涵蓋機器學習各個流程,包含自己生態的通用計算平臺,程式碼量也超過了50萬行。

為了後續維護和使用的方便,Angel將拆分成8個子專案,統一放在Angel-ML目錄下:

angel,PyTorch On Angel,sona(Spark On Angel),serving,automl,mlcore,math2和format。


騰訊明星AI開源專案再迭代:QQ微信都在用,全棧機器學習能力


傳送門:

— 完 —

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2654950/,如需轉載,請註明出處,否則將追究法律責任。

相關文章