對機器學習的一些懷疑理由

banq發表於2016-05-20
機器學習人工智慧是非常熱門的詞語,本文卻列出機器學習的幾個缺陷,這有助於人們重新思考機器學習。

首先,機器學習的模型只對你餵給它的資料表現得足夠好,比如一個預測系統,給出一個人的姓,該系統就能預測這個姓來自哪個國家,John也許是美國人,而Johannes也許是德國人。

但是如果你沒有使用中國姓名來訓練這個系統,它就無法辨識中文姓名了。

也就是說,如果你只用英文世界的大量資料訓練你的模型,而除了英文世界以外的情況你的模型就可能無法辨識。

其次,模型也有自己的bug,機器學習通常使用程式語言實現,而程式語言有bug。而且bug會超過普通程式,見:Machine Learning: The High Interest Credit Card of Technical Debt

最後,機器學習模型有可能全部錯了,假設你使用了經得起質疑的資料集去訓練你的模型,但是人們可能會愚弄它,比如google photo應該是用機器學習辨識圖片的,然後給這些圖片加上關鍵詞。作者準備在自己的google photo中搜尋baby圖片,結果出來的圖片中沒有一個是baby

對機器學習的一些懷疑理由

總結,Cathy O'Neil'的部落格一直談論出自一些統計模型的東西總會出現不是客觀事物,或者基本的正確性。

Carina Zona在Consequences of an insightful algorithm認為,機器學習模型會意想不到的負面後果,比如著名的目標懷孕Target pregnancy案例。

原文:

A few reasons to be skeptical of machine learning

相關文章