—— 完 ——
龍蜥社群成立DeepRec SIG,開源大規模稀疏模型深度學習引擎
龍蜥社群(OpenAnolis)(以下簡稱“龍蜥社群”)正式成立 DeepRec SIG,將攜手龍蜥社群開發者一道,致力於維護 Anolis OS 上的 DeepRec 元件,並將稀疏模型深度學習引擎引入龍蜥社群。
稀疏模型
是指在模型結構中離散特徵計算邏輯佔比較高的一類深度學習模型的統稱,其廣泛應用於搜尋、廣告、推薦等高價值業務中。當下主流開源深度學習框架,對稀疏模型的支援不足。國內外公司在稀疏場景使用的方案在系統性和全面性上存在著問題,技術複用上的難度導致無法大面積推廣,制約了不同場景下稀疏模型的探索和發展。
DeepRec SIG 作 為負責龍蜥作業系統上 DeepRec 相關開源軟體包的維護,構建搜尋、推薦、廣告場景模型的訓練及預測生態的利器, 現做如下介紹:
DeepRec 介紹
DeepRec 的優勢
1、模型效果
-
DeepRec 對不同的分散式策略進行了深度的最佳化,包括非同步訓練、同步訓練、半同步訓練等
-
DeepRec提供了豐富的針對稀疏模型訓練的圖最佳化功能,包括自動流水線SmartStage、結構化特徵、自動圖 Fusion 等等
-
DeepRec 中最佳化了稀疏模型中數十個常見運算元,並且提供了包括Embedding、Attention等通用子圖的 Fusion 運算元
-
DeepRec 中 CPUAllocator 和 GPUAllocator 能夠大大降低記憶體/視訊記憶體的使用量並顯著加速 E2E 的訓練效能。線上程排程、執行引擎方面針對不同的場景提供了不同的排程引擎策略
DeepRec 計劃每隔 1-2 個月進行版本更新,後續釋出的重點功能包括:
Serving: 開源完整的 Online Deep Learning(ODL),並持續最佳化 DeepRec 的 Serving 效能。
Embedding: 最佳化各個 Embedding 功能的可用性,提供 Embedding 的各種除錯工具,並持續最佳化 Embedding 多級混合儲存的效能。
Runtime: 提供統一的排程框架,最佳化多場景下任務排程的效能。持續最佳化記憶體、視訊記憶體、持久化記憶體分配器效能,並針對不同分配場景提供不同的記憶體分配器。
分散式: 持續最佳化非同步訓練、同步訓練、半同步訓練的效能。
硬體及運算元加速: 結合編譯最佳化、手動最佳化等手段最佳化計算效能;針對新的硬體進行持續最佳化,協同硬體團隊推動新型硬體在 DeepRec 落地。
此外 DeepRec 正在和核心團隊合作,針對稀疏模型的訓練/預測任務的特點,在核心排程、記憶體管理上進行針對性的最佳化。
龍蜥社群希望透過這個開放平臺,和外部開發者開展廣泛合作,進一步推動稀疏模型訓練/預測框架的發展,為不同業務場景中的搜推廣模型訓練和預測帶來業務效果和效能提升。
今天 DeepRec 的開源只是我們邁出的一小步。我們非常期待得到您的反饋。最後,如果你對 DeepRec 感興趣,歡迎你加入我們一起共建 ,為我們的框架貢獻一點你的程式碼和意見,這將是我們莫大的榮幸。
歡迎更多開發者加入 DeepRec SIG!
加入龍蜥社群
加入微信群:新增社群助理-龍蜥社群小龍(微信:openanolis_assis),備註【龍蜥】與你同在;加入釘釘群:掃描下方釘釘群二維碼。歡迎開發者/使用者加入龍蜥社群(OpenAnolis)交流,共同推進龍蜥社群的發展,一起打造一個活躍的、健康的開源作業系統生態!
龍蜥社群( OpenAnolis)是由 企事業單位、高等院校、科研單位、非營利性組織、個人等在自願、平等、開源、協作的基礎上組成的非盈利性開源社群。龍蜥社群成立於 2020 年 9 月,旨在構建一個開源、中立、開放的Linux 上游發行版社群及創新平臺。
龍蜥社群成立的短期目標是開發龍蜥作業系統(Anolis OS)作為 CentOS 停服後的應對方案,構建一個相容國際 Linux 主流廠商的社群發行版。中長期目標是探索打造一個面向未來的作業系統,建立統一的開源作業系統生態,孵化創新開源專案,繁榮開源生態。
目前, 龍蜥OS 8.4 已釋出,支援 X86_64 、Arm64、LoongArch 架構,完善適配飛騰、海光、兆芯、鯤鵬、龍芯等晶片,並提供全棧國密支援。
歡迎加入我們,一起打造面向未來的開源作業系統!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004278/viewspace-2886631/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 阿里巴巴開源大規模稀疏模型訓練/預測引擎DeepRec阿里模型
- 阿里巴巴稀疏模型訓練引擎-DeepRec阿里模型
- 龍蜥雲原生機密計算 SIG 成立,7 大開源專案重磅亮相!
- 龍蜥社群成立雲原生 SIG,引入 3 大核心技術,共建雲原生生態
- 龍蜥社群高效能儲存技術 SIG 11 月運營回顧 | 龍蜥 SIG
- 龍蜥社群&龍蜥理事長分獲 2023 開源創新榜“優秀開源社群、優秀開源人物”獎項
- 聊一聊龍蜥硬體相容性 SIG 那些事兒 | 龍蜥 SIG
- 大影片時代智慧加速引擎湧現科技加入龍蜥社群
- 晟盾科技加入龍蜥社群,共建開源新生態
- 永中軟體加入龍蜥社群,共建開源新生態
- 龍蜥社群召開理事閉門會,討論多項社群規劃
- 開源創新 源起潮“蜥”——龍蜥社群走進浪潮資訊 MeetUp 即將開幕
- 鑑釋加入龍蜥社群,助力開源生態建設
- 萬里資料庫加入龍蜥社群,打造基於“龍蜥+GreatSQL”的開源技術底座資料庫SQL
- 龍頭整機廠商寶德加入,共建龍蜥社群開源新生態
- 中電科技加入龍蜥社群,助力開源生態建設
- 龍蜥社群正式成立 RISC-V ARCH SIG!平頭哥、中科院軟體所 PLCT 實驗室等聯合共建
- eBPF SIG年度動態: eBPF和Wasm深度融合、參與7場活動及2023展望 | 龍蜥 SIGeBPFASM
- 龍蜥社群&龍蜥開發者獲CSDN2021年度技術影響力「年度開源專案」獎和「年度社群之星」
- 華創視訊加入龍蜥社群,攜手共建開源新生態
- InfoQ專訪龍蜥社群陳緒:從CentOS 停服說起,龍蜥作業系統的開源觀CentOS作業系統
- 常青藤開源科技加入,龍蜥社群再迎 HPC 和開源領域新夥伴
- 恭喜!龍蜥社群榮登 2022 科創中國“開源創新榜”
- 喜報!龍蜥作業系統&龍蜥社群雙雙榮登2021“科創中國”開源創新榜!作業系統
- 今天 2 點:關於龍蜥社群雲原生 SIG 及安全容器 runD 介紹 | 第 24 期
- 中興通訊加入龍蜥社群,共建ICT全場景開源生態
- 固態儲存廠商憶聯加入龍蜥社群,共建開源新生態
- 阿里開源!輕量級深度學習端側推理引擎 MNN阿里深度學習
- 演講實錄:百度大規模深度學習應用實踐和開源AI框架PaddlePaddle深度學習AI框架
- 大資料儲存領導廠商創新科加入,攜手龍蜥社群共建開源生態大資料
- 單個4090可推理,2000億稀疏大模型「天工MoE」開源大模型
- 贊!| 龍蜥及其理事分獲“2022 OSCAR 尖峰開源社群及專案、尖峰開源人物”獎項
- 大模型學習進階 1-搭建一個開源大模型大模型
- 4 月15-18 日,龍蜥社群與你相約北美開源峰會
- 中興新支點加入龍蜥社群,共建作業系統開源新生態作業系統
- 華雲資料加入龍蜥社群,推動開源產業快速有序成長產業
- 龍蜥社群理事長馬濤當選開放原子開源基金會 TOC 副主 席
- 崑崙芯科技加入龍蜥社群 ,賦能智慧開源,共築AI芯生態AI