圍棋,Marvin Minsky與人工智慧尚未跨越的鴻溝

PSI內容合夥人發表於2016-01-30

本文作者Gary Marcus是機器學習公司Geometric Intelligence, Inc.的創始人兼CEO,也是紐約大學心理學與神經科學教授,最新的著作是《大腦的未來( The Future of The Brain)》。謹以本文向Marvin Minsky致敬。

短短一週時間,人工智慧領域就發生了兩件大事。1月24日晚,人工智慧失去了一位最偉大的先驅者Marvin Minsky;28日,我們看到了在解決困擾人工智慧數十年的圍棋難題上所取得的重大進展。這兩件事都值得大書特書,但其中也出現了很多炒作和混淆視聽的言論。許多「AI威脅論」使人們試圖阻礙人工智慧的未來發展,而這對就業,甚至人類的未來意味著什麼,所以瞭解現在我們到底已經走到哪一步——什麼已經實現,什麼尚未完成——就非常重要了。

1-OH8ytZN_tVz76_It5GAhYQ

事實:DeepMind發表在《自然》雜誌上的論文展示了人工智慧在下圍棋上所取得重大進展,而下圍棋對機器的難度是眾所周知的。(本週早些時候另一篇由Facebook發表的論文也同樣報導了重大的進展。)

事實:DeepMind擊敗了歐洲圍棋冠軍。

流言:歐洲圍棋冠軍並不是世界圍棋冠軍,甚至還差得遠。例如,BBC的報導「谷歌實現AI『突破』,力挫圍棋冠軍」,另外還有其它數百家新聞媒體基本上也使用了類似的標題。但歐洲的圍棋幾乎算不上一項競技運動,這位歐洲圍棋冠軍的全球排名僅為633。一個擊敗排名633位職業網球選手的機器人卻是很了不起,但卻不能就此認定它“已掌握”這項運動。DeepMind取得了重大的進展,但其圍棋之旅仍未結束;YCombinator依據一條迷人的線索認為該程式(仍在進步中)目前的排名為279。

除了流言中的非典型問題,還有一個重要的技術問題:獲勝的計算機系統的本質是什麼?作為背景,長時間以來所謂的神經網路模型(其中最現代的形式被稱為「深度學習」)和已故的Marvin Minsky所主張的經典「有效的老式人工智慧(GOFAI)」系統之間一直存在著人們的爭論。Minsky,以及其人工智慧聯合奠基者John McCarthy在羅素的邏輯主義傳統中長大,並試圖以類似於邏輯語言的方式發展人工智慧。而另一些人,比如50年代的Frank Rosenblatt和現在的深度學習研究者Geoffrey Hinton以及Facebook的人工智慧負責人Yann LeCun,則一定程度上是在得益於神經科學的簡化神經元上構建模型。

讀過了許多媒體報導的文章(甚至包括我一些同事在Facebook上釋出的帖子)後,可以發現DeepMind的獲勝是神經網路方法的轟動性勝利,因此Minsky選錯了方向,他的方法已經完全失寵了。

但不要著急。如果你閱讀過DeepMind發表在《自然》上的論文(或真的只讀過摘要),你就知道AlphaGo並不是完全都是神經網路——實際上它是一個混合結構,結合了深度強化學習和經典人工智慧的一項基礎技術——樹搜尋(tree-search)。樹搜尋是Minsky的同事Claude Shannon在神經網路發明前幾年發明的(儘管其更現代的形式是蒙特卡洛樹搜尋),同時也是他的許多學生的早期成果的組成部分。

對於任何知曉認知科學歷史的人來說,有兩個人應該對這樣的結果非常滿意:Steven Pinker和我自己。Pinker和我在1990年頂著這一領域的巨大敵意,為結合聯想網路(associative network,即今日深度學習的前身)和經典符號系統的模組化系統進行遊說。這是Pinker的書《詞彙與規則》的中心論點,也是我1993年論文的核心。我們的主張引起了數十位學者激烈的爭辯,他們認為單一的、未分化的神經網路就足夠了。神經網路的兩位主要倡導者為經典的符號操縱系統(symbol-manipulating systems)進行了有名的辯護,而Pinker和我表示那並不是「人類計算的本質」。

如果你仔細讀過,可以看到《自然》的論文表明DeepMind著名的Atari遊戲系統中純淨的深度網路方法在圍棋問題上並不如混合系統,正如Pinker和我當初所預料的那樣。

當其發生時,Pinker和我正在Minsky方法的基礎上構建人工智慧。神經網路(現在以「深度學習」更為人知)領域的人經常辱罵Minsky。幾十年後,老套的人仍然還在拿Marvin 1969年的書《感知器》(與Seymour Papert合著)說事兒。在他們看來,Minsky和Papert無理取鬧地向神經網路的早期領域潑了一瓢冷水,被許多人認為是他們過早地扼殺了這一領域。用電腦科學家和作家Pedro Domingos的話來說:「如果機器學習的歷史是一部好萊塢電影,那大反派就是Marvin Minsky。」

但人們總是在亂講故事。通常的說法是Marvin宣稱不可能從神經網路中學到任何有趣的(「非線性」)東西。而Minsky和Papert真正說明的是不能使用現有的一些工具確保——證明——帶有隱藏層的神經網路可以收斂出一個正確方案。他們邀請讀者接受或反駁他們的猜想。2016年的網路越來越深,但它們與現實世界資料的工作方式仍然只有少量可證明的確定結論。

在關於圍棋的這篇論文被公之於眾的前幾個小時,我參加了一個會談,會上一位深度學習專家的研究生承認(a)這一領域的人仍然並不真正瞭解為什麼他們的模型會工作得這麼好,(b)如果將其模型放入與其被訓練的壞境明顯不同的壞境中進行測試,他們仍然不能真正確定任何結果。對許多神經網路領域的人來說,Minsky代表了邪惡帝國。但幾乎半個世紀過去了,他們仍舊沒有完全正視他的挑戰。

DeepMind的圍棋程式接下來會怎樣呢?短期來看,如果它真正擊敗了真正的世界冠軍,我也不會感到驚訝——也許很快,如他們所希望的三個月之後,或許是幾年之後。但長期來看就少些確定性了。真正的問題是這個在遊戲世界中開發的技術能否被應用於現實世界。IBM在利用深藍(國際象棋冠軍)和沃森(Jeopardy冠軍)打造有說服力的產品上一直磕磕絆絆。部分原因是現實世界和遊戲世界存在根本性的不同。在國際象棋中,每一個局面都只有大約30種不同的運動,規則也是固定的。Jeopardy中超過95%的答案是維基百科的詞條標題。在現實世界,任何問題的答案都涉及到所有事情,沒有人能想出該怎樣擴充套件人工智慧使其能在面對開放式的世界時能達到人類水平的複雜度和靈活性。

要全面瞭解,有必要瞥一眼《紐約時報》本週早些時候釋出的個人助理(如Siri和Google Now)評估文章。每一個系統都有他們特有的優勢和劣勢。但它們中許多甚至答不出下週參加超級碗比賽的隊伍是哪些。

人工智慧在現實世界中應用仍然是相當困難的。真正值錢的問題——現在還沒人知道答案——是通過圍棋測試的人工智慧能更快地應用到我們手中嗎?

相關文章