DeepMind依靠CBN統計方法來構建公平的機器學習模型
機器學習系統可以做出決策而不會受到人類主觀性的影響,但是,該論點僅部分正確。雖然機器學習系統不能根據感覺或情感來做出決定,但它們確實透過訓練資料集繼承了很多人為偏見。
偏見很重要,因為它會導致不公平,在過去的幾年中,可以減輕偏見的影響並提高機器學習系統的公平性的技術開發方面已取得了許多進步。幾個月前, DeepMind發表了一篇研究論文,提議使用一種稱為因果貝葉斯網路(CBN)的舊統計技術來構建更公平的機器學習系統。
我們如何在機器學習系統的背景下定義公平性?人類通常根據主觀標準來定義公平。在機器學習模型的上下文中,公平性可以表示為敏感屬性(種族,性別...)與模型輸出之間的關係。儘管方向正確,但該定義尚不完整,因為如果不考慮模型的資料生成策略就無法評估公平性。大多數公平性定義表示模型輸出相對於敏感資訊的屬性,而沒有考慮資料生成機制所依據的相關變數之間的關係。
由於不同的關係需要模型滿足不同的屬性才能公平起見,這可能導致錯誤地歸類為表現出不良/合法偏見的公平/不公平模型。從這個角度來看,識別資料生成機制中的不公平路徑與理解模型本身一樣重要。
瞭解有關分析機器學習模型中的公平性的另一個相關要點是,它的特徵擴充套件到技術構造之外,並且通常涉及社會學概念。從這個意義上講,視覺化資料集是識別潛在偏見和不公平現象的重要組成部分。從市場上不同的框架中,DeepMind依靠一種稱為 因果 貝葉斯 網路 (CBN)的方法來表示和估計大資料集中的不公平性。
因果貝葉斯網路(CBN)
因果貝葉斯網路(CBN)是一種統計技術,用於使用圖結構表示因果關係。從概念上講,CBN是由表示隨機變數的節點形成的圖,這些節點由表示因果影響的連結連線。DeepMind方法的新穎之處在於使用CBN對資料集中不公平屬性的影響進行建模。透過將不公平定義為來自圖中敏感屬性的有害影響的存在,CBN提供了簡單直觀的視覺表示,用於描述資料集基礎下的不同可能的不公平情形。此外,CBN為我們提供了一個強大的定量工具,可用 來測量資料集中的不公平現象,並幫助研究人員開發解決不公平現象的技術。
CBN的一個更正式的數學定義是一個由節點組成的圖,這些節點代表因果關係連結的各個變數。在CBN結構中,從節點X到節點Z的路徑定義為從X開始到Z結束的一系列連結節點。 如果存在從X到Z的因果 路徑 ,則X是Z的原因(有影響)。
詳細點選標題
相關文章
- 機器學習之使用sklearn構建據類模型,並且評價模型機器學習模型
- 【火爐煉AI】機器學習031-KNN迴歸器模型的構建AI機器學習KNN模型
- 機器學習實戰 | 性別預測模型的構建與優化機器學習模型優化
- 分散式機器學習中的模型架構分散式機器學習模型架構
- 【火爐煉AI】機器學習012-用隨機森林構建汽車評估模型及模型的優化提升方法AI機器學習隨機森林模型優化
- 統計機器學習機器學習
- 從預處理到部署:如何使用Lore快速構建機器學習模型機器學習模型
- ArcGIS模型構建器ModelBuilder的使用方法模型UI
- 統計學習方法筆記-感知機學習方法筆記
- 機器學習模型機器學習模型
- 使用Kubeflow構建機器學習流水線機器學習
- 從模型到部署,教你如何用Python構建機器學習API服務模型Python機器學習API
- 如何構建一臺機器學習伺服器機器學習伺服器
- 機器學習中的概率統計機器學習
- 機器學習4-模型的誤差來源以及減少誤差的方法機器學習模型
- 機器學習:神經網路構建(上)機器學習神經網路
- 機器學習:神經網路構建(下)機器學習神經網路
- 機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)機器學習
- 統計機器學習 -- 目錄機器學習
- 機器學習建議機器學習
- 程式設計介面的新動態:用 TensorFlow 高層 API 來構建機器學習模型 丨 Google 開發者大會 2018程式設計API機器學習模型Go
- 讀資料工程之道:設計和構建健壯的資料系統30機器學習機器學習
- 如何管理機器學習模型機器學習模型
- 欺騙機器學習模型機器學習模型
- 為什麼機器學習模型會越來越糟? - Santiago機器學習模型Go
- 機器學習導圖系列(5):機器學習模型及神經網路模型機器學習模型神經網路
- Amazon SageMaker AI創新重塑生成式AI與機器學習模型的構建與擴充套件AI機器學習模型套件
- 機器學習之使用sklearn構造決策樹模型機器學習模型
- 【火爐煉AI】機器學習014-用SVM構建非線性分類模型AI機器學習模型
- 統計學習方法
- 吳恩達《構建機器學習專案》課程筆記(1)– 機器學習策略(上)吳恩達機器學習筆記
- 吳恩達《構建機器學習專案》課程筆記(2)– 機器學習策略(下)吳恩達機器學習筆記
- 機器學習中用來防止過擬合的方法有哪些?機器學習
- 吳恩達機器學習筆記 —— 12 機器學習系統設計吳恩達機器學習筆記
- 【火爐煉AI】機器學習007-用隨機森林構建共享單車需求預測模型AI機器學習隨機森林模型
- 分散式機器學習中的模型聚合分散式機器學習模型
- 【機器學習】--隱語義模型機器學習模型
- 機器學習——決策樹模型機器學習模型