視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力

遊資網發表於2019-12-26
視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力

AI 已經橫掃了棋牌比賽,他們用人無法想象的招數打敗成名已久的棋手,重挫鋒芒畢露的天才。

就連唯一打敗過 AlphaGo 的李世石在退役時也感嘆一切已不復當年。「隨著 AI 在圍棋遊戲中的亮相,我已經意識到,即使我通過瘋狂的努力成為了第一名,我也並沒有位居榜首。」

視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力

AI 從某種程度上摧毀了這些成名選手的信心,但這並不能代表它們已經足夠聰明。

在 Google 軟體工程師 Francois Chollet 看來,AI 贏了比賽的成就並不是一個衡量智力的好標準。就像是你 5 歲的小侄女特別擅長拼樂高,她在樂高的拼接速度上甚至超過了你,但這並不能證明你侄女在其他領域都比你聰明。

在最近發表的論文《論智力的衡量》中,Chollet 提出的新觀點是人工智慧世界需要重新關注什麼是智力,什麼不是。Chollet 認為研究人員若想在通用人工智慧方面取得進展,他們需要超越視訊遊戲和棋牌比賽等現在流行的判斷標準,去思考那些實際上讓人類變得聰明的技能,比如概括和適應能力。

在人工智慧領域,有兩個不同的智慧概念。其中一種智慧是指能勝任多工的能力,而另一種則優先考慮適應性和泛化能力,即人工智慧應對新挑戰的表現能力。

在最早的 30 年,前者明顯更具影響力,即智力是一套靜態程式和一個明確的知識庫。而人工智慧社群中關於概念化智慧的討論則只獲得了極少的關注度。

視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力

Chollet 認為現在的研究人員應該認識到這一點,所有人只針對一個方向的研究並不是一件好事。在一個尚充滿未知的領域,這種態勢限制了研究人員發揮的空間。

AI 需要一個更好的智慧定義,而非一個靜態測試。

在靜態測試中,一旦你選擇了一個衡量標準,你就會採取任何可能的捷徑來「玩弄」它。例如,如果你把下國際象棋作為衡量智力的標準 (我們從上世紀 70 年代開始,一直到 90 年代都以此為標準),你最終會得到一個下國際象棋的系統,僅此而已。

沒理由認為它對其他任何事都有好處,這並不能教會你關於人類智慧的任何東西。如今在 Dota 或星際爭霸等電子遊戲中的人工智慧也陷入了同樣的智力陷阱。

視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力
▲ DeepMind 的研究人員觀察他們的 AI 在《星際爭霸 II》中如何對付人類玩家。

對於我們人而言,一個人技能的精通程度和智力是息息相關的。頂尖的程式設計師絕不是隻會碼程式碼,優秀的作家在藝術其他領域也頗有造詣,我們也會認為擅長圍棋的人就是聰明的人。

人類的大腦可以因其智力而在某個特定任務的技能上表現出色,但這不是一種單一的技能。比如從小開始學習圍棋的孩子,他們不是隻會下棋,他們同時也在學習數學、語言等基礎知識,圍棋之外可能還有程式設計、繪畫等愛好。這些孩子從零開始學習下棋,但他們不是專門「用來」下棋的,他們可以把這種學習能力引導到許多其他的任務中,學習其他內容,這就是通用性。

人工智慧的存在打我了我們原有的概念——擅長下棋的就是聰明的。人類在學習上的情況不適用於機器,人工智慧不是擬人化的。我們通用的智力可以用於特定的任務,但擅長特定任務的人不一定擁有通用的智力。一切是不可逆的。

視訊遊戲和棋牌比賽並不能很好地衡量 AI 的智力

在機器領域,只要您可以對單一任務進行無限的資料取樣,花費更多資源進行深度學習。那在單一領域你就可以很出色,人工智慧就可以在任意任務中獲得任意技能。

但這也不會讓你更接近一般智力。

在任何任務中,獲得高技能都不是智力的標誌。除非這個任務實際上是一個元任務。

來源:愛範兒
地址:https://www.ifanr.com/1293731

相關文章