美國大選之後的思考:AI能準確預測選民的行為嗎?

AMiner学术头条發表於2020-11-13

在經歷多天的“難產”之後,美國大選計票結果終於有個一個確定的結果,民主黨總統候選人喬·拜登確認勝選成為美國第46任總統。似乎這出年度大戲已經落下帷幕,但是,就在選舉之夜,第一輪計票開始後不到24小時,媒體和政治階層已經宣佈了一個失敗者:民調。

這不是民調第一次“發揮失常”,早在2016年大選後,許多民調專家還否認他們的職業一頭走向下坡路的說法:全國民調平均值預測,希拉蕊·克林頓(Hillary Clinton)將以略低於四個百分點的優勢贏得普選,她最終也以略高於兩個百分點的優勢在普選中獲勝。但是,美國的選舉是由選舉團中的搖擺州決定的,而不是由普選決定的。因此,那一年的最終結果也令大多數人始料未及。
美國大選之後的思考:AI能準確預測選民的行為嗎?(來源:AP / David Dermer)

那麼,是否有比傳統民調更準確的方法來預測選舉結果呢?

美國西雅圖非營利性研究中心艾倫人工智慧研究所執行長奧倫.埃齊奧尼(Oren Etzioni)表示:"我不會解僱民意測驗者,但我會引導他們更好地利用機器學習、資料探勘和人工智慧來更好地預測。

彷彿,人工智慧成了民調機構手裡的一棵救命稻草。

AI預測大選,需要幾步?

首先你需要明白,沒有一個人或演算法能夠一直準確預測人類的行為,然而,傳統民意測驗的的問題是,民意調查者使用的模型主要基於歷史分類和平均值。那麼我們就需要規避這些“僵硬”的資料指標。

然後,你需要一個資料來源,像亞馬遜這樣的科技公司能夠利用演算法捕捉實際行動,簡單來說,亞馬遜的演算法不管你是誰,它只知道:當你去買個狗項圈,那麼你也很可能會買狗糧。因此,這些反應行為的資料需要不斷地大量抓取,儘管很困難,但在動態識別助推機率預測的模式和相關性方面能帶來無限的幫助。

接下來就是建立模型,由於收集資料來源的側重點不同,建立的模型也會有差異。著名分析公司 KCore Analytics 就從社交媒體帖子中預測:拜登在民眾投票中將佔優勢——大約 8 或 9 個百分點——但在選舉團方面,優勢很小。具體操作是利用了一個端到端的框架在 Twitter 之類的網路中查詢影響者和主題標籤。根據內容和頻率選擇資料,然後在一個稱為 AWS-LSTM 的 AI 模型中對意見進行分類測算,據稱準確性高達 89.5%。而這一切都基於該公司使用超過 10 億條推文的資料探勘。

總部設在義大利的 Expert.AI 公司,嘗試分析一些因素如語氣和情感,並預測如何可能轉化為選票。相比於 KCore Analytics,Expert.AI 就顯得幹練很多,具體操作是利用一個知識圖來標識命名實體(包括人員、公司和地點)並嘗試對它們之間的關係進行建模。有趣的是,其系統將 84 個情感標籤貼在 Twitter 和其他網路的數十萬條帖子上,半自動地消除了機器人般的社交賬戶。

Expert.AI 的演算法將標籤按 1 到 100(反映其強度)的等級進行排名,並乘以每個候選值的匹配次數。同時,它將情緒分類為"積極"或"消極",並用它來建立一個可以比較兩個候選項的索引。結果顯示,拜登在社會媒體上的情緒排名更高,略高於川普(50.2% 對 47.3%)

無獨有偶,由渥太華大學的科學家開發的"Advanced Symbolics polly"收集了一個隨機的,受控的美國選民樣本,例如“黑人的命也是命運動”“中國問題”“新冠疫情”等。透過他們的帖子和在社交媒體上的談話進行識別。基於此預測得出:佛羅里達州將投票給拜登,並佔該州總票數的 52.6%。事實後來我們都知道,川普在此翻盤,一度讓盤面上的局勢膠著不下。
美國大選之後的思考:AI能準確預測選民的行為嗎?圖 | Advanced Symbolics polly 預測模型

以上都是一些透過抓取大資料來進行分析預測,當然也有一些機構對區域性資料進行收集,透過智慧“蜂群”放大,進而預測選民的意向。Unanimous.AI 就是這樣一個公司,該公司團隊 9 月份在美國進行的一項 50 人現場調查,要求他們預測他們認為誰將贏得 11 個州的總統競選,以及以什麼幅度贏得總統競選。

Unanimous.AI 的實時調查允許使用者實時檢視其他參與者正在選擇什麼,機器學習演算法根據答案變化等因素評估誰對自己的預測最有信心。最自信的答案對最終彙總答案的影響最大。不過雖然看起來該預測內容簡單,但是它已經正確地預測了 10 個州競選的獲勝者。可謂"戰績"斐然.。
美國大選之後的思考:AI能準確預測選民的行為嗎?圖 | Unanimous.ai 9月進行了一次現場調查,要求50名參與者預測誰將贏得11個戰場州的總統競選,以及以什麼優勢贏得總統競選(來源:UNANIMOUS.AI)

並非所有的 AI 投票都那麼準確

在 AI 預測將民意至於“顯微鏡”下的同時,我們也把 AI 預測推到民意驗測者的 “顯微鏡” 之下,可以預見,一些預測的確精準無比,但是類似“Advanced Symbolics Polly“這樣的 AI 預測系統也會“誤入歧途”,例如 Advanced Symbolics Polly 得出佛羅里達州將投票給拜登,佔該州總票數的 52.6% 的這一失準預測,就是因為該制度未能單獨抽樣古巴裔美國人(他們通常投票給共和黨候選人)。換句話說,Advanced Symbolics Polly 把古巴裔美國人和委內瑞拉裔美國人,墨西哥裔美國人混為一談,統一歸為"西班牙人"。

正如《財富》雜誌所指出的那樣,無論預測的正確與否,這些模式都沒有考慮到法律挑戰、無信仰的選民(選舉團成員不投票給他們承諾的候選人)或其他混淆者可能會影響選舉結果的方式。在這些不斷變化的引數條件下,AI 預測——就像傳統的民意調查一樣——似乎低估了 2020 年選民對川普的熱情,特別是在黑人和拉丁裔選民以及 LGBTQ 社群成員中。
美國大選之後的思考:AI能準確預測選民的行為嗎?(來源:紐約時報)

ASI 聯合創始人兼執行長艾琳.凱利(ErinKelly)表示:“使用人工智慧來預測選舉仍然是一個相對年輕的做法。AI 的優點之一是模型可以學習,並隨著時間的推移而變得更好。”

我們經歷的這一切似乎是一場輪盤賭博,在輪盤沒有停下的時候,誰都說不準命運的小球會滑向哪一個數字,但相較於人類而言,人工智慧在面對“賭局”的時候不會產生任何心裡起伏。它們只會不斷地積累資料,使最終結果逼近於正確答案。或許,對於 Advanced Symbolics Polly 那樣的預測 AI 來說,今年的選舉"只是一次學習經歷"。

參考資料:
https://www.wsj.com/articles/artificial-intelligence-shows-potential-to-gauge-voter-sentiment-11604704009?mod=tech_lead_pos11
https://venturebeat.com/2020/11/06/how-ai-predictions-fared-against-pollsters-in-the-2020-u-s-election/

AMiner學術頭條
AMiner學術頭條

AMiner平臺由清華大學計算機系研發,擁有我國完全自主智慧財產權。系統2006年上線,吸引了全球220個國家/地區800多萬獨立IP訪問,資料下載量230萬次,年度訪問量1000萬,成為學術搜尋和社會網路挖掘研究的重要資料和實驗平臺。

https://www.aminer.cn/
專欄二維碼

相關文章