演算法竟然偏見到了這種程度：為女性推薦低薪工作，快遞服務繞過黑人區

微胖發表於2018-01-21

編譯 | Rik R

來源 | futurism.com

在上世紀 80 年代，曾有一段時期，倫敦聖喬治醫學院採用了一種高科技的方法來篩選申請者。那是一個計算機程式，被首次用來概覽簡歷，從而做出初步篩選，每年大約要審查 2000 名候選人。該程式會分析招生記錄，以瞭解成功申請者的特點，從而進行相應的調整，直至與招生小組的決定相匹配。

但是在學習過程中，這個程式逐漸偏向於去尋找一些其它特點，不止於良好的考試成績和學術研究潛能。在該程式施行的 4 年後，該醫院的兩名醫生髮現，這個程式往往不去考慮候選者的學術成績，而是直接拒絕女性申請人，以及那些沒有歐洲名字的申請人。醫生們還發現，每年有多達 60 名申請者由於性別或種族問題而被拒絕參加面試。該程式將性別和種族偏見納入到了訓練資料中，本質上就是被教導，婦女和外國人不是做醫生的料。

30 年後的今天，我們正面臨著類似的問題，但現在這種程式的內部偏見情況則更為普遍，且偏見所佔決策的權重甚至更高。如今，從政府部門到醫療機構，機器學習驅動的人工智慧演算法已經無處不在，它們會基於歷史資料來做預測，從而輔助決策。在學習資料中的模式時，它們也吸收了其中的偏見，並使其永久性地得以保留。例如，谷歌更偏向於給女性推送低薪廣告；亞馬遜的當日送達服務繞過了黑人街區；還有幾類數碼相機軟體都在識別非白人使用者的面孔方面感到困難。其中最鮮明的例子是 COMPAS 演算法，該演算法被多個州政府的執法機構用於評估被告人再犯罪的風險，據 ProPublica 的一項調查顯示，黑人被錯誤標記為罪犯潛在分子的比例幾乎是白人的 2 倍。

很難弄清楚演算法中的偏見和公平，即使計算機專家也不行。其中一個原因是，演算法建立過程中的細節通常被認為是專有資訊，因而受其所有者的密切保護。對於更加高階的演算法，其結構邏輯異常複雜，以至其建立者也不知道它們的工作方式。這就是人工智慧領域中所謂的黑盒子問題：我們不能看到演算法的內部，無法理解它如何做出決策。如果沒有解決好這個問題，許多人所曾譴責規避的歷史歧視資料，將被演算法永久性地編碼進人類的未來，從而摧毀我們的社會。

這些擔憂曾在電腦科學界的一小部分人中被輕聲低吟過幾年，現在正成為這一領域的重點討論物件。在過去的 2 年裡，人工智慧領域中有關公平問題的論文數量出現了巨大的增長。具備了這種公眾意識，社會各方的責任感也在與日俱增。Kate Crawford 是一名微軟的研究員，以及紐約大學 AI Now 機構的聯合創始人，他在最近的一次演講中問道，「是否存在一些我們不應該建立的東西呢？」

「機器學習終於迎來了它的黃金時間。如今，我們正試圖使用它來達成現實世界中的數百個不同目標，」微軟高階研究員 Rich Caruana 告訴 Futurism 說道，「人們有機會去部署具有危害性的演算法，從長遠來看，這會累加為相當大的社會影響……現在，每個人都突然間意識到，這是人工智慧領域一個重要的新篇章。」

演算法讓我這麼做

我們已經與演算法磨合了很長一段時間，但是黑盒子問題似乎前所未有。早期的演算法更簡單而透明。其中許多仍然在使用中，例如 FICO 的信用評分演算法，每一個新演算法的應用都有對應的法律規定。

「人們幾十年來一直在使用信用評分演算法，但這些領域都有很嚴格的法規，且會隨著這些預測演算法的使用而不斷對其進行調整。」Caruana 說道。這些法規能夠確保預測演算法可以為每一項打分提供一個對應的解釋：比如你的貸款審批沒有通過，原因是你的貸款餘額過高，或是你的收入太低。

在其它一些領域，比如法律界和廣告業，法規不會對信用評分公司所使用的晦澀演算法作要求。你可能不知道自己為什麼會被拒絕貸款或找不到工作，因為沒有人能夠強迫該演算法的所有者解釋其工作原理。「但我們知道，由於 [演算法] 都是基於真實世界的資料來訓練的，它們都會有失偏頗——因為現實世界就帶有偏見，」Caruana 說道。

譬如語言，它是最明顯的偏見來源之一。當演算法從書面文字中進行學習時，它們會在那些經常一起出現的單詞之間發現一些聯絡。例如它們可能會學習到，「男人之於計算機程式設計師正如女人之於家庭主婦。」當這一演算法被用來為一份程式設計工作匹配合適的簡歷時，它將更可能選擇男性而非女性。

解決諸如此類的問題相對來說比較容易，但是很多公司根本就不願意這樣做。相反，他們遮蔽了一些適當的資訊以隱藏這種不一致性。如果不知道演算法的細節，在許多情況下，甚至專家也無法判斷其中是否存在偏見。

因為這些演算法是私密的，且處於監管機構的管轄範圍之外，公民幾乎不可能對這些演算法的創造者提起訴訟。那些曾經的訴訟者並沒能走多遠。2016 年，威斯康星最高法院駁回了一名男子要求審查 COMPAS 演算法原理的請求；一名叫 Eric L. Loomis 的訴訟人被判處了 6 年有期徒刑，部分原因是 COMPAS 認為他具備「高風險。」Loomis 稱，法官對一個不透明的演算法的依賴侵犯了他的法定訴訟權益。最後此案被提交給了美國最高法院，並於 2017 年 6 月宣告訴訟失敗；另有 2 位法學教授，花了一年的時間來調查各州在其刑事司法系統中如何使用評分演算法。他們的調查所證實的唯一一件事是，這條資訊被很好地隱藏在了保密協議的背後。

但這些公司不可能無限期地享受自由。今年 3 月，歐盟將出臺相關法律，要求公司有能力就其演算法的工作及決策原理向前來諮詢的客戶做出解釋。

美國沒有進行這類立法。但有跡象表明，這種趨勢可能正在席捲更多的監管監督機構。2017 年 12 月，紐約議會通過了一項法案，將設立一個專項調查小組來研究城市機構所使用的演算法，並探索出方法來讓其演算法決策過程被大眾所理解。

黑盒子鑑定

無論監管機構介入與否，在演算法的開發和部署中，文化的轉變或許可以減少偏見演算法的應用比例。隨著越來越多的公司和程式設計師都對其演算法的透明性和可解釋性做了承諾，對於那些沒有給出承諾的公司，一些人希望將它們公之於眾，讓它們失去民心。

近年來，計算能力的提高已經使人們有可能創造出準確且可解釋的演算法，而這一技術挑戰正是開發商一直以來在努力克服。最近的研究表明，在累犯預測的準確度方面，是存在且可以建立出能夠比肩 COMPAS 等黑盒子演算法的可解釋模型的。

「這項研究結果就擺在那兒，我們知道如何建立出非黑盒子版模型，「杜克大學電腦科學及電氣和計算機工程系副教授 Cynthia Rudin 告訴 Futurism，「但要讓人們注意到這項工作則有些困難。如果政府機構終止了黑盒子模型研究的贊助補貼，則或許有點幫助。如果法官們拒絕使用黑盒模型進行判決，也會有所幫助。」

其他人正在努力想出一些方法來測試演算法的公平性，即在一個新演算法被髮布到世界之前，建立一個由檢查項與平衡項所組成的系統對其進行評估。這就好比一種新藥想進入市場，就必須通過臨床試驗。

「現在的情況是，模型的開發與部署速度太快了。康奈爾大學統計學博士生 Sarah Tan 告訴 Futurism，整個試驗過程都沒有適當的檢查步驟，現實世界中的測試環節也缺少相應的規定。

理想的情況是，開發人員應該從他們的訓練資料中清除已知的偏見，比如性別、年齡和種族，並執行內部模擬來檢查他們的演算法是否還有其它潛在的問題。

同時，在最終釋出前，確保所有演算法都經過嚴格的測試，有幾種方法可以找出哪些演算法可能會受到偏見的影響。

在最近的一篇文章中，Tan、Caruana 及其同事描述了一種新方法來理解黑盒子演算法可能的工作原理。該團隊基於 COMPAS 預測出的累犯的風險評分資料，建立了一個模擬黑盒子演算法（比如 COMPAS）的模型。他們還基於真實世界的結果建立了另一個模型，即那些被預測為累犯的人是否真的又犯罪了。比較這兩種模型，研究人員可以在不剖析演算法的前提下評估該預測評分演算法的準確性。比較這兩個模型的輸出結果之間的差異，能夠找出各個變數（種族或年齡等）在一種或另一種模型中的權重。他們的研究結果與 ProPublica 和其他研究人員的發現一致，即 COMPAS 對黑人是有偏見的。

修正這種偏見可能會帶來巨大的回報。如果設計得當，這些演算法將會消除刑事司法、警務和社會其它領域中根深蒂固的偏見。

「如果我們真的致力於此，併成功地減少了偏見，我們就可以擁有一個良性的反饋迴路，那時，事實上演算法會慢慢幫助我們減少對彼此的偏見，使我們成為一個社會共同體。」Caruana 說道。演算法竟然偏見到了這種程度：為女性推薦低薪工作，快遞服務繞過黑人區

RSS生成工具/服務推薦
2022-01-29
完了，這個硬體成精了，它竟然繞過了 CPU...
2020-08-16
震驚！亞馬遜竟然做出這種事，讓快遞員可以隨便進入你的家！
2018-03-08
亞馬遜
快遞都比外賣快了？快遞按下“加速鍵” 今年雙11快遞為什麼這麼快？
2022-02-28
全球快遞業女性佔比超30% 女快遞員卻很少
2020-10-29
幾種常見的JS遞迴演算法
2019-12-05
JS遞迴演算法
快遞服務平臺有哪些板塊
2024-11-29
快遞服務平臺有哪些型別
2024-11-29
型別
遞推--街區
2020-11-02
認知偏見之行動偏見
2022-04-26
申通快遞：2022 年 12 月快遞服務業務收入 30.5 億元同比增長 8.31%
2023-01-21
現代世界50種認知偏見
2021-12-20
7-1推薦演算法業務
2024-08-11
演算法
豐網是什麼快遞，用優質服務贏得口碑的快遞品牌
2023-02-06
你見過最差的演算法工程師能差到什麼程度？
2020-05-15
演算法工程師
快應用、快服務、服務直達…這些到底是啥玩意
2020-05-19
還有這事？竟然吃到了自己家的瓜
2022-04-27
2020優質的VPS服務商推薦
2020-05-22
快遞物流資訊訂閱與推送API：打造高效的快遞物流資訊服務
2024-02-21
API
豐網快遞不斷最佳化服務，進一步提升快遞質量
2023-05-09
規範網際網路資訊服務演算法推薦活動WIOT
2022-03-14
演算法
快遞不打烊還須服務不走樣YPC
2022-03-19
java接入國內1200+家快遞公司的遞寄件服務
2021-07-15
Java
【推薦】最常見的5種網路攻擊型別！
2022-12-21
型別
菜鳥裹裹：2020年快遞員報告女性快遞員增長超20%
2021-01-08
《艾爾登法環》為什麼能夠火到這種程度？
2022-03-08
【推薦】最常見的三種Python字串格式化的方法！
2022-11-30
Python字串格式化
【推薦演算法】推薦系統的評估
2024-12-03
演算法
演算法分析__遞推方程
2019-03-05
演算法
一種3位sar adc工作過程推導（二）
2021-03-25
通過CaaS理解雲服務三種模式的區別：IaaS，PaaS，SaaS
2018-03-22
模式
【FAQ】接入華為帳號服務過程中常見問題總結
2022-06-02
微服務呼叫中出現傳遞過來的物件為空的幾種情況
2018-04-15
微服務物件
常見的三種HTTP代理服務型別
2022-06-08
HTTP型別
應對快遞流量高峰，豐網快遞這樣提升配送效率
2023-04-10
遞推演算法與遞推套路（手撕演算法篇）
2021-10-29
演算法
遞推演算法與遞推套路（演算法基礎篇）
2021-10-13
演算法
幾種通用防注入程式繞過方法
2020-08-19
關於SSRF和多種繞過方式
2022-02-10

演算法竟然偏見到了這種程度：為女性推薦低薪工作，快遞服務繞過黑人區

相關文章