助力AI技術共享,螞蟻開源又一核心技術“因果學習系統 OpenASCE”

雲端計算頻道發表於2023-12-11

  當地時間 12 月 10 日,為期 6 天的 AI 國際頂會 NeurIPS (Neural Information Processing Systems) 在美國路易斯安那州新奧爾良市開幕。NeurIPS 是全球人工智慧和機器學習領域的會議,與 ICML 並稱為人工智慧領域難度最大,水平最高,影響力最強的會議。

  會議首日,中國網際網路企業螞蟻集團受邀舉辦主題為“知識增強 AI 在垂直行業的應用探索”(Knowledge-enhanced AI for Industry Verticals)的研討會,並在會上開源了業界首個分散式全鏈路因果學習系統OpenASCE (Open All-Scale Causal Engine)。

  因果推斷主要研究如何從資料中推斷因果關係,是資料科學領域的重要分支,而傳統的機器學習則主要依賴資料中的相關關係。融合因果推斷和機器學習可以同時發揮兩者的強項,我們稱之為因果學習。因果學習作為一種深入理解資料和決策背後關係的技術,在資料驅動的運營和決策中扮演著重要的角色。OpenASCE (Open All-Scale Causal Engine) 根植於螞蟻集團多年積累的實踐經驗和技術突破,相較於業界已有的一些開源框架,支援全鏈路大規模因果學習,包含因果發現、因果效應估計和歸因,覆蓋了因果各個領域的相應實現。在因果發現上,OpenASCE 支援分散式貝葉斯網路結構搜尋,能夠處理百節點百萬樣本資料;同時支援基於連續最佳化的因果發現,支援萬級節點億級樣本資料。

  OpenASCE 實現的大規模分散式因果糾偏樹可以在 4 小時內完成 1 億樣本的訓練任務,是業界唯一的分散式因果提升樹實現。此外,OpenASCE 還進一步沉澱了 20 多個工業級因果學習演演算法,包括 15 個以上因果技術和深度學習結合的因果表徵學習方法,有效降低了因果技術的工業應用門檻,在螞蟻集團內部實現了規模化應用。

  比如信貸風控團隊透過 OpenASCE 的因果學習方法,可以更準確地識別出風險因素和客戶行為之間的因果關係,大幅提高了風險控制的精度和效率。在營銷最佳化方面,OpenASCE 能夠幫助營銷人員有效尋找“營銷敏感人群”,提升業務指標。在推薦場景中,因果推斷可以幫助機器學習糾正資料中的偏置,去除偽相關,學習更穩定的因果關係。

  據瞭解,技術開源是螞蟻集團的重要技術戰略,螞蟻集團在人工智慧、資料庫、雲端計算、隱私計算、安全可信等領域都擁有自主可控的關鍵開源技術,截至目前,共計開源了 1700 多個程式碼倉庫,積累了 100 多個社群頭部開源專案。《COPU2022 中國開源發展藍皮書》顯示,螞蟻開源影響力排名國內前三,其中重點開源的 9 大技術均為支撐支付寶的核心技術。


原文作者:螞蟻集團;連結:https://blog.itpub.net/31545808/viewspace-2999608/,如需轉載,請註明出處,否則將追究法律責任。

相關文章