AI Now提出十大建議,公共機構選擇黑箱性質AI技術首先遭到「警告」

微胖發表於2017-10-25

編譯 | 項文虎 高靜宜 王藝

作者 | AI Now Institute

來源 | Medium

近日,美國研究組織 AI Now 釋出第二份人工智慧年度研究報告。這份報告是「AI Now」人工智慧研討會的一部分,該研討會邀請了近百名相關領域內的研究人員,討論人工智慧對社會經濟的影響。報告指出,人工智慧技術正發展迅速,尚處於早期階段的人工智慧技術正在從人臉掃描、人力推薦以及網路借貸等常見的應用場景中不斷滲透到我們的日常生活裡。

儘管人們對快速發展的人工智慧抱有很大的預期,但是我們也看到了這一高風險的領域正面臨巨大的挑戰。例如在刑事司法中,非盈利媒體 ProPublica 的調查小組發現,法庭和執法部門用於預測刑事被告再犯的演算法,可能對非裔美國人存在一定的偏見。這一現象隨後被許多學者證實。在醫療保健領域,匹茲堡大學醫學中心的研究發現,一種用於治療肺炎患者的 AI 系統,缺失了一項對嚴重併發症的風險評估。在教育領域,德克薩斯州的評教演算法被暴露出存在嚴重的缺陷,教師們也成功起訴了他們所在的學區。

或許這些例子僅僅是一個開始,未來還會有更大的挑戰。其中一部分原因在於,目前的 AI 領域缺少標準化的測試模式和稽核方法,無法完全避免演算法偏差,保障絕對的安全。

然而,這些早期的 AI 系統正被應用到多個行業,包括醫療、金融、法律、教育以及各種辦公場地。這些系統也已經滲透到我們生活的方方面面,它們可以用於預測我們的音樂愛好、生病的概率、適合的工作以及借貸的數額等。

這裡的問題不是蓄意對人工智慧的濫用。而是人們在使用 AI 技術的過程中,沒有用於確保公平公正的流程和標準,更沒有思考它們所帶來的社會效應。當研發的藥品在推向市場之前,它必須要經過嚴格的科學測試,並持續檢測其中長期的效果。其實高風險 AI 的應用也當如此。謹慎是非常必要的,因為如果一旦出錯,許多人會受到嚴重的傷害。

作為報告的一部分,AI Now 還為 AI 產業的研究人員和政策制定者提供了 10 條建議。這些建議並不是完整的解決方案,只是進一步工作的起點。AI Now 稱:「儘管 AI 產品正在迅速發展,但對演算法偏見和公正的研究仍處於起步階段,如果我們想要確保 AI 系統得以被負責任地部署與管理,需要做的事情還很多。」

建議一:刑事司法、醫療、福利和教育等高風險領域內的核心公共機構不應再使用具有「黑箱」特性的 AI 技術及演算法系統,包括未經稽核和驗證的情況下使用預訓練模型,採用由第三方供應商授權的 AI 系統及內部建立的演算法。

公共機構使用這類系統會嚴重引起人們對這類法定訴訟程式的擔憂。這些系統至少要經歷公共審計、測試及審查的過程,符合相應的問責標準。

這將帶來一個重大的轉變:提出的這項建議反映了 AI 及相關係統已經對部分重大決策產生影響。過去的一年裡,也有許多能夠作證這一點的研究報告。人們在朝著這個方向邁進,本月,紐約市議會就開展了一項關於保障演算法決策系統的透明度和測試的相關法案。

建議二:在釋出 AI 系統之前,企業應該進行嚴格的預釋出測試,以便確保系統不會因訓練資料、演算法或其他系統設計的原因導致任何錯誤及偏差的發生。

AI 是一個發展迅猛的領域,開展測試的方法、假設以及測試結果,都應該是公開透明、有明確版本的,這有助於應對更新升級以及新的發現。

那些開發系統並從中獲利的人應該肩負起相應的測試及保障環節的責任,包括預釋出版本的測試。AI 領域距離標準化方法的實現還有很長的路要走,這也是建議這些方法和假設需要公開稽核和討論的原因。如果隨著時間的推移,AI 領域能夠制定出具有魯棒性的測試準則,那麼這種開放性是至關重要的。另外,即便在標準化方法中,實驗室測試也不能捕捉到所有的錯誤和盲區,這也是建議三出現的原因。

建議三:在 AI 系統釋出之後,企業需要繼續監測其在不同環境和社群中的使用情況。

監測方法和結果的定義需要一個公開、嚴謹的學術過程,要對公眾負責。特別是在高風險決策環境中,應該優先考慮傳統邊緣化社群的看法和經驗。

確保 AI 演算法系統的安全性問題是非常複雜的,是一個針對給定系統生命週期的持續過程,而不是一個完成後就可以遺忘的短期檢驗。只有在動態的使用案例和環境中進行監測才能確保 AI 系統不會在假設和領域發生改變時引入錯誤和偏差。同樣值得注意的是,許多 AI 模型和系統都有通用性,產品可能會採用一些即插即用的附加功能,如情感檢測或面部識別等。這意味著那些提供通用 AI 模型的企業也可以考慮選擇已經批准使用的功能,這些經過許可的功能已經把潛在的負面影響和風險等因素考慮在內。

建議四:需要進行更多的研究並制定相應的政策讓 AI 系統用於工作場所管理和監測中,包括招聘和人力資源環節。

這項研究將補充目前自動化取代工人的這一研究焦點,應該特別注意對勞工權利和行為的潛在影響,以及操縱行為的潛力以及在招聘和晉升過程中無意強化的偏見。

圍繞 AI 和勞動力的爭論通常會集中在工人流離失所的問題上,這是一個非常嚴重的問題。然而,瞭解 AI 演算法系統在整個工作場所中的使用情況也同樣重要,包括行為推動,到檢測環節,再到績效評估過程。例如,一家名為 HireVue 的公司最近部署了一項基於 AI 的視訊面試服務,可以分析求職者的講話、肢體語言、語調,從而確定求職者是否符合一家給定公司的「優秀」模型。鑑於這些系統存在降低多樣性並鞏固現有偏見的可能性,人們需要做更多的工作來充分理解 AI 是如何融入管理、招聘、排程以及日常工作場所中的實踐中的。

建議五:制定標準,跟蹤系統整個生命週期的啟動、開發過程和訓練資料集的使用情況。

這是為了更好地瞭解和監控偏差及代表性曲解問題。除了更好地記錄訓練資料集的建立和維護過程,AI 偏差領域的社會科學家和測量研究員應該繼續檢驗現有的訓練資料集,並努力理解已經存在在實際工作中的潛在盲區和偏差。


依賴於大規模資料,AI 才能發現模式並作出預測。這些資料反映人類歷史的同時,也不可避免地反映了訓練資料集的偏差和成見。機器學習技術山擅長提取統計模式,常常會在試圖概括常見案例的過程下省略不同的異常值,這也是不根據資料表面價值進行偏差研究的重要原因。這樣的研究要從理解訓練 AI 系統的資料來自哪裡開始,追蹤這些資料是如何在系統中使用的,而且要隨著時間推移驗證給定資料集的形態。在掌握這一點的基礎上,人們可以更好地理解資料中反映出的錯誤和偏差,進而研發出能夠在資料的開發和採集中識別這種情況並將其削弱的方法。


建議六:以跨學科視角看待 AI 的偏差研究與緩解策略的研究。


偏差問題長期以來一直存在,並且是一個結構性問題,深度的跨學科研究是解決偏差問題的必要途徑之一。在技術層面,研究者們往往希望能一勞永逸地徹底解決問題,這嚴重低估了問題放在社會層面時的複雜性。在教育、醫療、刑事司法等領域,偏差問題的趨勢源於其自身的歷史程式和過往實踐,如果不結合相應的領域知識,偏差問題就不能被徹底解決。要解決偏差問題,一定需要跨學科的合作,並尊重不同學科的規則。


最近,人工智慧以及偏差演算法領域有了一些喜人的進展。但在這裡,我們還是要提醒諸位不要閉門造車。否則,很有可能出現這樣的情況——系統雖然一直在優化,但我們卻不知道怎樣用這個越來越優化的系統解決問題。電腦科學家能夠通過與諸如法律、醫學、社會學、人類學和交流學等領域的專家合作,在 AI 資料形成以及上下文整合之前,更好地理解資料底層的結構性不平等問題。


建議七:亟需 AI 系統落地時的審查標準與規範。


該標準的制定應結合不同學科及聯盟的觀點,以公開、嚴謹的學術態度進行,並須定期審查和修訂。目前,還沒有確定的能夠評估 AI 系統在其應用的社會領域中所產生的影響的理論體系。考慮到目前尚處於早期的人工智慧系統已經給一些危險程度較高的的社會領域造成了影響,這一問題必須被重視起來,甚至可以說是當務之急。


建議八:AI 領域的公司、大學、會議以及其他利益相關者應該公佈參與其工作的女性、少數族裔、以及其他邊緣群體的人數。


現在有很多人已經意識到,AI 領域研究人員缺乏多樣性這一問題,但還沒有細粒度資料論證該問題的嚴重性。為了建立真正的多元文化工作場所,我們需要對科技行業的工作文化進行更深層次的評估。這需要資料的支撐,而不僅僅是多僱傭女性和少數族裔這樣簡單。


創造 AI 系統的人本身持有的假設和觀點必會影響到 AI 系統的走向。目前,人工智慧的開發者多為男性白人,他們有著相似的教育背景。目前已經有足夠多的證據表明這會造成問題,比如語音助手對女性聲音的辨識度不如男性,又或是 AI 助手在為女性提供健康資訊時所表現出的乏力。文化的多樣性研究在泛科技領域已經有一定的進展,但在 AI 領域,目前成果寥寥。如果 AI 希望朝著安全、公平、能夠被廣泛應用的方向發展,我們的動作就不能僅停留在 AI 公司文化多樣性的調查中層面,更要深入改變、確保 AI 公司是歡迎女性、少數族裔、以及其他邊緣群體的。


建議九:AI 行業應該聘請來自電腦科學以外的學科的專家,並確保他們擁有決策權。


隨著 AI 在不同社會和機構領域的應用日益增加,並能夠影響越來越多的高風險決策,我們必須努力將社會科學家、法律學者和其他具有領域專長的人結合起來,共同指導人工智慧的建立和整合,以形成長期的實踐規範。


舉個例子,我們不應該期望 AI 研究者能夠成為刑事司法專家,就像我們不應該讓律師為深度神經網路調參一樣。這一例子可以被擴充套件到所有需要整合資訊科技的行業。因此,在諸如法律、健康、教育等領域,我們需要領域專家參與進來,幫助領導決策,確保 AI 不會幼稚地低估該領域中複雜的流程、歷史、環境。


建議十:AI 需要強力的道德監管以及問責機制來確保其行駛在正確的道路上。


對於如何將高水平的道德原則和指導方針與日常的開發過程、推廣和產品釋出週期聯絡起來,我們還有很多功課要做。


為了確保 AI 的安全與平等,一些 AI 機構在開發程式的過程中優先考慮道德相關問題。然而,這樣的考慮往往出於團隊的自願,而且只有相對高階的組織才會將公眾利益放在較高的優先順序。而且,問題是,公眾利益將怎樣決定?將由誰決定?除了誰代表公眾利益這一問題,AI 程式碼在道德方面還需要連線明確的問責制度,而且還須時刻意識到,AI 行業在激勵模式和權利分配方面存在不對稱的情況。AI Now提出十大建議,公共機構選擇黑箱性質AI技術首先遭到「警告」

相關文章