騰訊Angel PowerFL聯合專案團隊斬獲iDASH-2021國際隱私計算大賽差分隱私賽道冠軍

Editor發表於2022-01-28

1月28日,iDASH-2021國際隱私計算大賽結果正式公佈,騰訊雲Angel PowerFL和騰訊安全聯合專案團隊提交的方案,憑藉領先的模型準確率和最快的推理速度獲得差分隱私賽道冠軍。在去年的iDASH 可信計算賽道上,騰訊雲也斬獲冠軍,成為中國企業屆首次在可信計算(SGX)賽道上奪冠的技術團隊。

 

iDASH比賽是隱私計算國際最權威的比賽,已經舉辦八屆,是由美國國立衛生研究院 (NIH) 主辦,專注於雲環境下的隱私計算問題和麵向隱私保護的機器學習問題,已成為全球基因組資料隱私保護和安全共享領域最高規格的國際競賽。

 

歷年來,iDASH國際隱私計算大賽吸引了包括麻省理工學院、耶魯大學、谷歌、IBM等在內的學界及業界的頂尖團隊參賽。今年更有EPFL、華盛頓大學、天普大學、新加坡A*STAR、IBM、三星集團、螞蟻集團等在內的來自15個國家的69支參賽隊伍參與角逐,在區塊鏈、同態加密、差分隱私三個賽道中展開比拼。

 

其中,在差分隱私賽道,大賽組委會要求參賽團隊實現基於差分隱私的兩方橫向聯邦學習模型訓練,用於透過已知表型樣本預測野生型轉甲狀腺素蛋白澱粉樣心肌病。這裡的主要挑戰是要滿足差分隱私要求,訓練資料具有很稀疏的特徵,並且兩方擁有的資料是非獨立同分布的。

 

值得一提的是,今年iDASH-2021差分隱私賽道吸引了來自世界各地的30個頂級團隊報名參與競逐,其中有9個參賽團隊提交了技術方案和實現程式碼,並獲得了有效的比賽成績。騰訊雲Angel PowerFL和騰訊安全聯合團隊提交的技術方案在合理的時間內完成了滿足差分隱私要求的兩方聯邦學習模型訓練,獲得了領先的模型準確率,且具有最快的模型推理速度。

 

在實際應用中,離線模型訓練可以在允許的時間內完成,而線上模型推理需要最優速度,且模型準確率(或AUC)是首要指標。在騰訊提交的方案裡,首先,聯邦學習各參與方利用指數機制篩選重要特徵用於建模,從而提高模型準確率和加快模型推理。其次,參與方在其本地基於所選擇的特徵生成多個邏輯迴歸模型,並基於指數機制選擇模型傳送給對方。最後,參與方透過對多個模型輸出結果進行平均的方式生成聯邦整合學習模型。傳統的基於聯邦平均的聯邦學習方案不能很好的處理非獨立同分布資料,會導致聯邦模型效果差。騰訊提供的聯邦整合學習方案,可以有效應對非獨立同分布資料問題,提升聯邦模型的準確率。

 

據瞭解,騰訊Angel PowerFL團隊是國內較早開展聯邦學習研究和應用的團隊,在大資料、分散式計算、分散式機器學習、分散式訊息中介軟體、安全多方計算、密碼學等領域都有豐富的研發和應用經驗,已發表近10篇聯邦學習研究論文,提交了50多件聯邦學習技術發明專利申請,完成多個商用隱私計算和聯邦學習的產品研發。

 

騰訊雲安全隱私計算平臺Angel PowerFL源於騰訊的大資料和安全技術生態,支援超大規模資料量的多方聯合建模和聯合統計分析,擁有高效能和高容錯性,且不依賴於可信中心節點,目前已經在騰訊內外部眾多業務場景中落地應用,並取得了良好的效果。

相關文章