12月9日,2022年iDASH國際隱私計算大賽結果正式公佈,騰訊Angel PowerFL聯隊憑藉最優的模型效果和較快的推理速度獲得最高綜合得分,斬獲同態加密賽道冠軍。從兩年前首次參賽到現在,騰訊已經連續獲得2020年可信計算賽道冠軍和2021年聯邦學習賽道冠軍,贏得了iDASH隱私計算大賽“三連冠”,這在國內尚屬首次!
同時,在多方安全計算(MPC)賽道和可信計算(SGX)賽道上,騰訊Angel PowerFL聯隊也分別取得了第二和第三的好成績。
歷年來,同態加密賽道一直是iDASH比賽中最受關注和角逐最激烈的賽道。今年iDASH同態加密賽道題目是安全模型推理,要求參賽隊訓練機器學習模型,透過基因型(genotype)資料預測顯型特徵(phenotypes),共有五個預測任務,包括三個迴歸任務和兩個分類任務。主要挑戰是要求模型引數和測試資料都要加密保護,模型推理需要在密文下完成。
針對五個預測任務,騰訊Angel PowerFL聯隊在iDASH公開的資料集上分別訓練了三個線性迴歸模型和兩個邏輯迴歸模型,獲得了接近滿分的模型效果指標。在進行安全模型推理時,利用CKKS同態加密演算法加密五個線性模型的引數和待測試資料矩陣,在密文下完成模型推理,並透過最佳化密文矩陣和密文向量乘法獲得了單執行緒下最優的模型推理速度。
據瞭解,今年iDASH同態加密賽道吸引了來自世界各地的30多個頂級團隊報名參與競逐,包括來自耶魯大學、EPFL、浙江大學、Intel、螞蟻集團、位元組跳動等機構的參賽團隊。其中,有23個參賽團隊提交了技術方案和實現程式碼,獲得了有效的比賽成績。騰訊Angel PowerFL提出了多個創新性的解決方案,並最終在安全模型推理結果和推理速度上獲得最高綜合得分。
今年iDASH多方安全計算賽道題目是安全記錄關聯,要求參賽隊在兩個資料庫中安全的關聯屬於同一個病人的記錄,主要挑戰是病人記錄資訊可能有缺失和錯誤,且不能洩露任何病人資訊。騰訊Angel PowerFL聯隊創新的提出了基於機器學習的解決方案,在iDASH公開的資料上訓練了邏輯迴歸模型,並基於電路隱私求交(Circuit-PSI)與混淆交換網路(Oblivious Switching Network)實現了全匿蹤模型推理,獲得了最高的準確率。騰訊提出的解決方案適用性廣,可應用在金融、政務等場景中。
此外,今年iDASH可信計算賽道題目是根據細胞基因片段分佈的相似性對細胞進行安全聚類,主要挑戰是要在多個Intel SGX Enclave環境內實現分散式安全聚類解決方案。騰訊Angel PowerFL聯隊提出的基於訊息佇列(Message Queue)構建分散式解決方案是所有獲獎隊伍中唯一一個可以在多機上執行的方案,是真正的分散式解決方案,具有很好的擴充套件性,支援海量資料計算,可應用於生產環境下基於SGX的大規模分散式可信計算。
iDASH比賽是目前隱私計算領域國際上最權威的比賽,至今已經舉辦九屆,是由美國國立衛生研究院 (NIH) 主辦,專注於隱私計算和麵向隱私保護的機器學習問題,已成為全球基因組資料隱私保護和安全共享領域最高規格的國際競賽。
今年的騰訊Angel PowerFL聯隊匯聚了來自騰訊大資料、騰訊安全、騰訊計費、騰訊雲、騰訊廣告AI、華中科技大學的密碼學、隱私計算、大資料和機器學習領域的技術專家。騰訊Angel PowerFL隱私計算團隊是國內較早開展隱私計算與聯邦學習技術研究和應用的團隊,在大資料、分散式計算、分散式機器學習、分散式訊息中介軟體、多方安全計算、應用密碼學等領域都有豐富的研發和應用經驗,已發表近10篇隱私計算研究論文,提交了60多件隱私計算技術發明專利申請,有多個商用隱私計算和聯邦學習的平臺產品目前已經透過騰訊雲對外開放。