還在擔心機器人?人工智慧目前水平還不如初中生

行者武松發表於2018-03-01

參與科學測試的800個人工智慧都難以及格,AI還需努力。



從2011年,Watson在問答節目Jeopardy上擊敗了最優秀的人類選手,到2016年穀歌的人工智慧系統打敗了歐洲圍棋冠軍,人們似乎對人工智慧能夠超越人類智慧的可能性就更加堅定了。2012年,IBM的人工智慧系統Watson成功被克利夫蘭診所勒納大學醫學院錄取,開始了它的醫學研究生涯。醫學生們希望Watson經過訓練能夠在對醫學的理解能力上更進一步。但是,經過三年的訓練,最終的結果似乎並不盡如人意。


Watson並沒有通過美國八年級(相當於初二)的科學測試,嚴格來說並不符合醫學院的錄取條件,當初被允許進入醫學部恐怕也有不少的水分存在。


華盛頓大學的電腦科學教授Oren Etzioni和艾倫人工智慧研究所近期舉辦了一場比賽,邀請到800個人工智慧團隊,並將其AI系統進行八年級的科學測試。最終結果顯示,表現最好的也就及格水平而已,可見大部分的人工智慧系統的能力還不如八年級的學生。


這次長達五個月的測試足以可見人工智慧的發展現狀,深度神經網路的推出促進了人工智慧的發展,再加上Google、Facebook、微軟等在影像語音識別領域的迅速發展,已經使得人工智慧達到了比較高的人類表現水平。但是想機器達到人類的思考水平,就目前的技術而言並不是一件現實的事,甚至連基本的對話功能與科學測試都不能滿足,想要更進一步的發展還需不懈的努力。


科學測試是比問答節目、圍棋比賽都難的一個專案,不僅包含知識的問答,還要求能夠理解基本的概念。比如其中的一個多項選擇問題:一些魚類成熟後的多數時間都生活在鹽水中,但會在淡水中產蛋。它們適應不同環境的能力是什麼的最佳例證?機器人就無法解決,就算是使用神經網路也無法答出來。對此,Etzioni表示,自然語言的處理、推理、以及理解相關的概念都是非常複雜的問題,需要更多的推理運算才能夠解決。


雖說參賽的大多數人工智慧系統都是學術機構或是獨立的研究員研發出來的,但是就算是巨頭科技企業生產出來的產品應該也不會強太多。谷歌的表現可能會好一點,但是大眾的集體智慧也同樣不容小覷。


此次IBM拒絕參賽,對外的解釋是由於對這樣的比賽沒有什麼興趣,現在關注的重點是現實世界問題的解決。此外,Watson也早已經不是最為合適的測試物件,以前是針對問答比賽,現在已經發展成為一系列人工智慧工具的集合產品了,並不能充分代表大眾的水平。


此次Etzioni的測試主要是對於語言處理的能力,可以瞭解機器對於人類語言的理解程度。現在IBM的服務也已經包含了自然語言的處理問題。而從Watson問世以來,該技術已經受到了深度神經網路的影響,就像是可以使用大量的貓咪圖片教會神經網路識別貓一樣,也可以使用對話來進行自然語言的理解訓練。比如谷歌正在開發一種聊天機器人,可以和你探討人生意義。


雖說這種聊天機器人的技術並沒有什麼信服力,但是現在的人工智慧早已經不單單是一種技術,在未找到通用方法之前,就需要更多的機器學習和人工智慧工具。但是儘管在此次的Etzioni測試中,參賽者已經使用了很多的工具,結果並不是非常地理想。


也有人表示讓機器去進行科學測試並不具備太大的意義,應該關注更加深遠的領域,多項選擇、自然語言的理解、科學測試等等都不是人類應該追求的目標,真正要做的應該是智慧程式可以自然掌握內容。當然,憑現在的技術,想要實現這個目標還需要更加的努力。

原文釋出時間:2016-02-18 16:43
本文作者:宇瞄
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。


相關文章