德國爆冷門輸給韓國隊,完美證明AI預測模型真的還不太行!

機器之心發表於2018-07-16

說實話,很震驚!德國隊居然被韓國隊 2-0 擊敗,灰溜溜地回國了。要知道德國隊四年前就以 7-1 的驕人戰績擊敗了巴西隊,進一步又贏得 2014 年的世界盃。

出現這種情況,無疑會出現很多有待解答的問題。

德國爆冷門輸給韓國隊,完美證明AI預測模型真的還不太行!

2015 年機器人足球世界盃現場照片

但是,預計德國隊會有良好表現的不只有粉絲。至少有兩個不同組織開發的人工智慧(AI)模型都預測德國隊會挺進決賽。

據 Vice 報導,來自德國多特蒙德工業大學、慕尼黑工業大學和比利時根特大學的一個團隊分析了 10 萬個場景,最後預測德國隊獲勝的機率最高。不甘人後的高盛則分析了 100 萬個場景,預測巴西隊會與德國隊在最終決賽相遇並贏得冠軍。

只要你沒有聽從這些人工智慧的建議跑去賭球,就沒什麼損失。

但用在我們的日常生活中以決定對我們真正重要的事情的機器學習技術與預測獲勝球隊的技術並沒有什麼不同——而且隨著 AI 的發展,未來的應用只會更多。

所以這次事件在人工智慧實際應用方面會給我們帶來哪些經驗教訓?

1. 人工智慧做的是預測。簡而言之,人工智慧會尋找資料中的模式,然後使用這些模式來預測模式識別會給出怎樣的結果。計算機本身並不理解自己所處理的內容——它只是預測接下來可能會發生的情況。

2. 機率很關鍵:任何資料科學家都總是會在模型輸出的結果上加上機率和置信度水平。確定性不是他們的標誌。學術論文《Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters》預測德國隊有 86.5% 的機率小組賽出線,獲勝的機率則為 17.1%(略低於西班牙隊獲勝機率 17.8%)。(參閱原文獻,請點選閱讀原文。)

3. 人類大都不能很好地處理機率:我們大多數人都更習慣以二元論的視角看待事物——不是「是」就是「否」。被數學覆蓋的灰色地帶需要深思熟慮。所以 17.8% 的獲勝機率就成了人們眼中「被預測的贏家」。


4. 我們自身關於決策和預測的語言也能反映這個情況。政治家可沒法透過討論某些事情的發生機率來贏得選舉。我們喜歡確定性,也響應確定性。

5. 當預測因子和處理過程可以清楚呈現,並且最終成為一個閉環系統時,是有可能得到預測結果的。任何事物都可以被建模,並被提供給計算機處理。值得注意的是,上述學術研究在 8 組預測中有 6 組都預測對了——即至少出現了最高機率的情況。


德國爆冷門輸給韓國隊,完美證明AI預測模型真的還不太行!

預測中的德國隊獲勝之路(來自 Vice)

6. 可獲得的資料會得到優先考慮,而這(顯然)會影響輸出結果。這個學術團隊分析了「FIFA 排名、每個國家的人口和國內生產總值(GDP)、博彩公司的賠率、有多少國家隊球員在同一個俱樂部效力、球員平均年齡以及他們贏得過多少冠軍聯賽」。所有球隊的這些資料都是可獲得的,都有標準化的且可比較的格式,並且可能都是乾淨的並且有適當的標註的。因此這是人工智慧模型需要關注的重點。


7. 但是,實際資料總是多於可被處理的資料。這項研究沒有包含的資訊實際上還有無限多——球員的睡眠質量、個人身體素質、草地狀態、當天粉絲熱情的影響……能處理的資料都是可獲得的資料。如果不存在讓某支球隊獲勝的絕對公式,那麼建模就是不可能的。而人工智慧被應用的很多領域其實並不存在這種情況——比如最佳化工廠流程以製造完美的小部件。

8. 但是,即使最聰明的模型也難以應對突發事件——而且實際上會讓其整個前提條件沒有意義,甚至有害。如果一場火災損壞了這個小部件工廠的一部分,那麼人工智慧管理系統將一無是處。

9. 所以即使機器的作用越來越大了,也仍然需要人類參與其中。想讓機器成功,複雜性和動態變化以及用於解決這些問題所需的常識知識仍然是有待攻克的主要難題。

10. 媒體可能會過度解讀涉及人工智慧的一切。對人工智慧故事的炒作往往超出本質——不過就是個厲害點的 Excel 電子表格,媒體往往就因為「人工智慧」這個詞就將這種技術描繪得具有神秘和神奇的力量。


作為一個英格蘭隊支持者,現在我只關心一點——高盛更新後的模型認為英格蘭隊將會進入決賽!

相關文章