IBM AI辯手對戰世界級人類辯手,炒作還是秀肌肉?

weixin_33895604發表於2019-02-13

北京時間2月12日早上9:00,一場特殊的辯論賽在美國舉行,IBM研發的AI辯手\tProject Debater迎戰人類辯手。四次榮獲艾美獎,同時也是辯論節目“Intelligence Squared”主持人,John Donovan主持本次比賽。經過將近1小時的激辯,比賽最終以人類選手獲勝而落下帷幕。以下是詳細報導。

“機”不如人,AI辯論尚差火候

\"image\"

主持人 John Donvan

人機辯論賽的規則是這樣的:參賽雙方在賽前均不知道辯論的題目,所以選手無法進行提前準備,這也就增加了比賽的難度,最終的結論將由觀眾以投票的方式進行判決。

\"image\"

Project Debater與Harish Natarajan

辯論的話題為:是否應該對學前教育進行補貼。人類辯手Harish Natarajan迎戰,Harish是劍橋大學的碩士生,曾在牛津大學獲得政治、哲學和經濟學學士學位,目前是劍橋聯盟協會的現任辯論官,曾獲得2012年歐洲辯論冠軍。

\"image\"

辯論話題:是否應該對學前教育進行補貼

這場辯論賽除了吸引不少現場觀眾外,還線上上引發了超過5000人同時觀看及討論。在比賽剛剛開始的時候,就有好事者問觀看的網友:支援AI還是人類選手?不知是出於惡搞的目的還是真實的想法,有不少人都為AI打call。

\"image\"

最終的結果可能讓他們失望了,人類辯手守住了辯論領域的疆土,人工智慧暫時無法在這一領域擊敗人類。不過,Project Debater憑藉強大豐富的知識庫,讓觀眾學到了更多的知識,在這一方面仍舊獲得了較高的票數。

\"image\"

但是在一些觀眾來看,這場比賽仍舊是炒作大於實用的一場秀。

有網友評論道:辯論比賽本就帶有較強的主觀性,最終的比賽結果由觀眾投票決定,就這一點上來說,人為操作的可能性就增加了不少。如果一開始不告訴觀眾哪一方是AI,通過匿名展示的方式進行辯論以及投票,或許更能體現出AI的水平。

AI辯手:噱頭or實用產品?

說起IBM的Project Debater,作為一個AI辯手,這並不是它首次與人類辯手比賽。

Project Debater於2018年首次亮相,當時它與兩名人類辯論家Noa Ovadia和Dan Zafrir進行了辯論。主題分別是:“是否應該補貼太空探索費用”和“是否應該增加遠端醫療的使用”。在那場比賽的過程中,Project Debater不僅能夠與其對手進行辯論,甚至可以與辯手開玩笑,並最終贏得了比賽。

\"image\"

在CES 2019大會上,IBM也將Project Debater進行了展示,研發人員表示:眾包演講(Speech By Crowd)的應用前景很是廣泛,小至訓練校園辯論隊、大至準備訴訟案件的論證,都可以在 AI 的幫助下完成。

研發人員認為,Project Debater代表了一種新的AI挑戰,因為AlphaGo相比,辯論是更具開放性的活動,這種根本差異具有重要意義。在複雜的棋盤遊戲中,AI系統可能會提出任何確保獲勝的策略,即使一些棋路不能被人類所理解,而在辯論中,情況則完全不同, 人工智慧系統必須適應人類理性,並提出人類可以遵循和理解的推理路線。

其次,與之前的棋類挑戰形成鮮明對比的是,在辯論中,AI系統無法依賴自然評分功能。個人行動的價值,即論據,往往具有內在的主觀性;此外,甚至沒有商定的客觀指標來確定誰是贏家。Project Debater證明人工智慧可以在這個未知領域發揮重要作用,研發人員相信它將實現一種新穎的決策形式,將人與機器協同結合,讓人們做出更明智的決策。

為了開發Project Debater,IBM研究團隊必須賦予系統三個功能,每個功能都在AI中開闢了新天地:

1)資料驅動的語音寫作和交付: Project Debater能夠消化大量語料庫,並且給出一個有爭議的主題的簡短描述,寫出結構良好的語音,並以清晰的方式進行表述,甚至在適當的時候加入幽默元素。

2)聽力理解:識別對手長期連續口語中隱藏的關鍵概念和主張的觀點。

3)對人類困境進行建模:以獨特的知識表示模擬人類爭議和困境,使系統能夠根據需要提供原則性的論據。

專家觀點:有意義的開始,僅限於開始

為了給各位讀者更加深度的解讀這場比賽,我們採訪到了海知智慧CEO謝殿俠先生,作為同行,謝殿俠老師也觀看了這場比賽,在他看來,Project Debater專案是個有意義的開始,但是也僅限於開始。

他認為,從積極的方面來看,Project Debater對於長句子內容的語音識別、語義理解都是有一定進步的,它可以通過對海量語料進行搜尋,從而抽取事實,形成一定的邏輯,對於具體觀點可以推理判斷與決策,這樣的嘗試是有意義的。

但是,這一切的前提是:僅限於命題辯論

8分鐘的發言,Project Debater或許可以通過搜尋進行文字匹配,促成有一定觀點的回覆,但是本質上來說,它並沒有真正理解對手的論點和論據,普適性不夠強,如果遇到開放性主題,最終呈現的效果可能差別會非常之大。

謝殿俠告訴我們,如果用棋類比賽的AI進行類比,目前的Project Debater就像早期的國際象棋選手“深藍”,通過算力可以計算出一些結果,但是也僅限於國際象棋領域。如果遇到圍棋這樣充滿變化的棋類遊戲,深藍或許也會“歇菜”,只有AlphaGo這樣擁有學習能力,可以自我升級的AI才會稱霸圍棋遊戲。

謝殿俠說,對於Project Debater這類AI來說,最終的發展目標是能夠“自由辯論”的境界,然而受限於目前的技術,幾乎沒有一款AI產品達到這個位置,所以Project Debater是一個有意義的開始,但是能夠真正達到人類辯手的水平,仍需要努力。

參考連結:

https://www.cbronline.com/opinion/project-debater-ai

https://edition.cnn.com/2019/02/11/tech/ai-versus-human-ibm-debate/index.html

相關文章