對機器學習的一些懷疑理由
機器學習人工智慧是非常熱門的詞語,本文卻列出機器學習的幾個缺陷,這有助於人們重新思考機器學習。
首先,機器學習的模型只對你餵給它的資料表現得足夠好,比如一個預測系統,給出一個人的姓,該系統就能預測這個姓來自哪個國家,John也許是美國人,而Johannes也許是德國人。
但是如果你沒有使用中國姓名來訓練這個系統,它就無法辨識中文姓名了。
也就是說,如果你只用英文世界的大量資料訓練你的模型,而除了英文世界以外的情況你的模型就可能無法辨識。
其次,模型也有自己的bug,機器學習通常使用程式語言實現,而程式語言有bug。而且bug會超過普通程式,見:Machine Learning: The High Interest Credit Card of Technical Debt
最後,機器學習模型有可能全部錯了,假設你使用了經得起質疑的資料集去訓練你的模型,但是人們可能會愚弄它,比如google photo應該是用機器學習辨識圖片的,然後給這些圖片加上關鍵詞。作者準備在自己的google photo中搜尋baby圖片,結果出來的圖片中沒有一個是baby
首先,機器學習的模型只對你餵給它的資料表現得足夠好,比如一個預測系統,給出一個人的姓,該系統就能預測這個姓來自哪個國家,John也許是美國人,而Johannes也許是德國人。
但是如果你沒有使用中國姓名來訓練這個系統,它就無法辨識中文姓名了。
也就是說,如果你只用英文世界的大量資料訓練你的模型,而除了英文世界以外的情況你的模型就可能無法辨識。
其次,模型也有自己的bug,機器學習通常使用程式語言實現,而程式語言有bug。而且bug會超過普通程式,見:Machine Learning: The High Interest Credit Card of Technical Debt
最後,機器學習模型有可能全部錯了,假設你使用了經得起質疑的資料集去訓練你的模型,但是人們可能會愚弄它,比如google photo應該是用機器學習辨識圖片的,然後給這些圖片加上關鍵詞。作者準備在自己的google photo中搜尋baby圖片,結果出來的圖片中沒有一個是baby
總結,Cathy O'Neil'的部落格一直談論出自一些統計模型的東西總會出現不是客觀事物,或者基本的正確性。
Carina Zona在Consequences of an insightful algorithm認為,機器學習模型會意想不到的負面後果,比如著名的目標懷孕Target pregnancy案例。
原文:
相關文章
- CEO懷疑IT部門的五大理由(轉)
- 對響應式程式設計的懷疑 - lukaseder程式設計
- 對技術的一些疑問
- 對C# 2.0中匿名方法的種種懷疑分析(轉)C#
- 自我懷疑的開發者:你夠好嗎?
- CVPR2020 | 對抗偽裝:如何讓AI懷疑人生AI
- “不敢去懷疑程式碼,又不得不懷疑程式碼”記一次網路請求超時分析
- MySQL 一個讓你懷疑人生的hang死現象MySql
- 開始懷疑Spring框架的jdbc事務處理方式Spring框架JDBC
- 檔案操作的一些疑問
- 機器學習入門實戰疑問機器學習
- 恕我直言,我懷疑你並不會用 Java 列舉Java
- spring-boot版本問題讓開發懷疑人生Springboot
- JD Power:大多數美國人對EV和自動駕駛技術仍持懷疑態度自動駕駛
- 別再懷疑自己的智商了,Raft協議本來就不好理解Raft協議
- ValueObject和DTO模式的一些疑問Object模式
- Flex屬性你真的搞清楚了嗎?我深表懷疑Flex
- 畢業即失業,找工作找到懷疑人生 | 十年系列
- 波音遭遇勒索軟體攻擊, WannaCry 成為最大懷疑物件物件
- 懷疑前端元件把我的excel檔案搞壞了,怎麼證明前端元件Excel
- 懷疑iPhone光線感應器失靈?教你在家自己檢測iPhone
- 關於Multiple Buffer Pools的一些疑問
- netty系列之:不用懷疑,netty中的ByteBuf就是比JAVA中的好用NettyJava
- Prolifics Testing:調查發現美國最懷疑5G技術
- 關於機器學習的一些看法機器學習
- DDD中Factory和Repository的一些疑問
- 我懷疑這是IDEA的BUG,但是我翻遍全網沒找到證據!Idea
- 對CQRS架構的幾點疑問架構
- 對 ForumThread 建模的一點疑問thread
- GMTIC | Eric Thain—為什麼企業管理者仍在懷疑資料的重要性?AI
- 關於String內的indexOf方法的一些疑問Index
- 緬懷賈伯斯對軟體行業的貢獻行業
- Elasticsearch 的一些常見疑問(持續更新中)Elasticsearch
- jmock 進行單元測試的一些疑問Mock
- 產品化機器學習的一些思考機器學習
- 選擇HHDESK的理由三【檔案對比功能】
- 面對TypeScript,堅持JS的理由是什麼?TypeScriptJS
- 對一個執行計劃的疑問