機器學習拜占庭容錯方法: Bulyan

Luuumos發表於2022-12-02

原文網址 : https://www.cnblogs.com/luuumos/p/16937169.html

論文連結：http://proceedings.mlr.press/v80/mhamdi18a/mhamdi18a.pdf

SGD存在問題

資料並行的SGD梯度聚合是所有梯度的線性組合，即：
\(F(G_1, ..., G_n) = \sum_{i=1}^n\lambda_iG_i\)
因此一個惡意的節點可以讓全域性模型朝著自己想的方向偏移（\(G_n\)為惡意節點的梯度）：
\(G_n = \dfrac{1}{\lambda_n}(U - \sum_{i=1}^{N-1}\lambda_iG_i)\)
如圖所示：

由此，我們需要新的梯度聚合規則（GAR）

\((\alpha, f)\)-Byzatine Resilient GAR定義

\((\alpha, f)\)解釋：包含\(f\)個拜占庭梯度；\(\alpha\)為角度
如果某演算法為\((\alpha, f)\)-Byzatine Resilient演算法，則滿足以下規則：

輸出的梯度為一個與正確的梯度\(g\)相差最多為\(\alpha\)的梯度
輸出的梯度為被正確的梯度\(g\)的矩所約束的梯度

現有\((\alpha, f)\)-Byzatine Resilient GAR舉例：Krum, Multi-Krum, Brute等。

Krum演算法介紹

要求：n ≥ 2f + 3
演算法步驟：

計算節點i的梯度與其餘節點j（鄰居節點）的梯度的距離（歐氏距離）
選取距離自己最近的n-f-2個梯度，然後將選取的梯度求和，作為節點i的得分score
得分最小的節點的梯度即為演算法輸出的梯度

Brute演算法介紹

要求：n ≥ 2f + 1
演算法步驟：

列出所有可能的簇（每個簇中包含n - f個節點）
找到最緊密相連的簇（該簇中距離最遠的梯度是所有的簇中距離最近的）：
將找到的簇中的節點的梯度取平均

GARs缺陷

模型引數包含遠大於1的維度，由此\(L_p\)範數較難辨別出以下兩種惡意攻擊：

每個維度上的微小變化
單一維度上的巨大變化
這樣就較難收斂到一個較好的模型

Bulyan演算法

要求：n ≥ 4f + 3

選出\(\theta\) = 2\(f\) + 3個梯度（根據Krum或Brute等演算法選）
對梯度的每一維都選出\(\beta\) = \(\theta\) - 2\(f\) ≥ 3個值，這些值是距離每一維梯度的中位數最近的值
計算均值

結果

可以看出來在使用norm 2攻擊的情況下，Bulyan準確率與沒有攻擊下的Average聚合演算法的準確率大致相同。

Bulyan優點

相較於其它演算法(Krum、GeoMed)代價較小，平均計算複雜度為\(O((n-2f)C+dn)\)
該演算法可以在每個維度上工作，即可以識別出某一個變化很大的維度（克服了Krum演算法的缺陷）。之所以可以工作在每一個維度上，是因為Bulyan結合了例如Trimbed Mean的演算法，處理了每一個維度。

實用的拜占庭容錯系統
2018-08-26
NEO共識協議：授權拜占庭容錯機制如何工作
2019-01-30
協議
區塊鏈時代的拜占庭容錯：Tendermint(二)
2018-08-16
區塊鏈
機器學習之迭代方法
2020-06-12
機器學習
機器學習/深度學習書單推薦及學習方法
2018-04-12
機器學習深度學習
機器學習實驗出錯總結
2024-05-06
機器學習
機器學習問題方法總結
2018-10-11
機器學習
機器學習方法（一）——梯度下降法
2018-10-12
機器學習梯度
【機器學習】機器學習簡介
2018-11-29
機器學習
機器學習的文字摘要方法概述 - kdnuggets
2020-11-12
機器學習
[python學習]機器學習 -- 感知機
2020-10-19
Python機器學習
強化學習與其他機器學習方法有什麼不同？
2019-03-06
強化學習機器學習
【機器學習】--Python機器學習庫之Numpy
2018-04-06
機器學習Python
大型機器學習【Coursera 史丹佛機器學習】
2021-09-09
機器學習
（一）機器學習和機器學習介紹
2021-09-09
機器學習
機器學習-整合學習
2019-05-12
機器學習
如何學習機器學習
2019-02-01
機器學習
機器學習（——）
2018-06-19
機器學習
機器學習
2024-05-19
機器學習
機器學習演算法迴避了科學方法 - thenewstack
2021-09-08
機器學習演算法
【方法論】機器學習演算法概覽
2018-08-01
機器學習演算法
機器學習中常見優化方法彙總
2018-08-25
機器學習優化
機器學習--分類變數編碼方法
2020-10-01
機器學習變數
人工智慧 (02) 機器學習 - 監督式學習分類方法
2019-12-18
人工智慧機器學習
人工智慧 (03) 機器學習 - 監督式學習迴歸方法
2019-12-18
人工智慧機器學習
人工智慧 (05) 機器學習 - 無監督式學習群集方法
2019-12-19
人工智慧機器學習
機器學習（十四）機器學習比賽網站
2018-12-06
機器學習網站
統計學習方法筆記-感知機學習方法
2023-05-16
筆記
12 月機器學習新書：《可解釋機器學習方法的侷限》，免費下載！
2020-01-06
機器學習新書
機器學習&深度學習之路
2018-06-07
機器學習深度學習
機器學習之學習速率
2020-06-12
機器學習
機器學習學習筆記
2021-06-01
機器學習筆記
機器學習-整合學習LightGBM
2023-02-21
機器學習
機器學習：監督學習
2022-12-04
機器學習
機器學習 | 吳恩達機器學習第九周學習筆記
2018-11-22
機器學習吳恩達筆記
【機器學習】機器學習面試乾貨精講
2018-03-29
機器學習面試
【機器學習】李宏毅——機器學習任務攻略
2022-12-14
機器學習
系統學習機器學習之半引數方法（二）--基於密度
2018-12-08
機器學習

機器學習 拜占庭容錯方法: Bulyan