第3講回顧:聯邦學習FATE演算法模組梳理及建模演示

聯邦學習FATE入門與應用實戰發表於2020-03-18

「AI開發者成長計劃」首期公開課由機器之心與微眾銀行聯合開設,主題為《聯邦學習FATE入門與應用實戰》,特邀合作伙伴 VMware 也將參與分享。 公開課為期4周,共6期課程 ,設定主題分享、專案實踐、線上答疑等環節,從零入門聯邦學習。

整體學習計劃與加入方式請檢視:《聯邦學習FATE入門與應用實戰》公開課上線!

3 月 17 日,機器之心聯合微眾銀行開設的公開課《聯邦學習 FATE 入門與應用實戰》第三講結課,微眾銀行人工智慧部演算法研究員譚明超為我們分享了《聯邦學習 FATE 演算法模組梳理及建模演示》。 

第三課精選問答

Q:請問稀疏資料input都有哪些?

我們現在主要支援的是兩種,tag和tag:value,比如說我這個人是不是有車、有房、是男是女等等,tag:value就是說比如說年齡:40,身高:1.6米等等。

Q:union是做什麼?針對橫向聯邦嗎?

不是,union是一個單邊的元件,它只是把兩個元件輸出的資料合併起來而已,就只幹這一個事情。

Q:預測的結果在哪裡看?僅guest方持有嗎?

對,只有guest方持有,在縱向聯邦當中是這樣的。對於橫向聯邦,每一方都有自己的模型,一般來講在橫向的模組當中是不需要加密的,但是橫向lr我們是提供了對host加密的模型計算方法。這種情況下,Host方是拿不到這個模型的。

Q:預處理及特徵工程可以介紹一下麼?

目前FATE實現的特徵工程元件包括取樣、聯邦特徵分箱,聯邦特徵選擇、特徵歸一化、onehot編碼等等。具體的內容,在github上有詳細的文件介紹:https://github.com/FederatedAI/FATE/tree/master/federatedml/feature

Q:如何對資料質量進行評估?

在建模的時候,FATE提供了一個local_base的元件,可以使用本地的資料建模,從而和聯邦以後的建模效果進行比對。除此以外,還可以看看交集的數量,求對方特徵的iv值進行比較等等方式。

Q:如果沒有同態加密的,聯邦和分散式有什麼區別?

這個區別還是挺大的。分散式是你自己的的叢集,你自己可以隨便訪問資料,但聯邦學習即使沒有用到同態加密,比如說只用了安全聚合的方式,你也是access不到別人的資料的,對於arbiter來說,只能得到最終所有模型聚合的和。

相關文章