創立於 2010 年的人工智慧創業公司 Vicarious 在 2013 年宣佈破解 CAPTCHA 之後,受到了連線、MIT 科技評論等媒體的廣泛關注。而後,Yann Lecun 公開發文稱,謹防人工智慧炒作,並稱其為教科書式的反面範例。他認為,在獲得基準普遍接受的頂級成果之前,千萬,千萬不要不要輕易相信人工智慧創業公司的模糊宣告。MIT 科技評論近期再次發文報導 Vicarious,表示這家後來一直潛形匿影的公司將於今年晚些時候釋出論文和 Demo。(附:Yann Lecun 公開共享的對 Vicarious 的評價。)
如果沒有想象,生活將會多無聊啊。事實上,計算機最大的問題可能就是他們沒有任何想象力。
正是這一想法促使創始人們成立了 Vicarious,這是一家神祕的人工智慧公司,得到了矽谷一些最知名的公司的支援。受到資訊流過大腦的方式的啟發,Vicarious 正在開發一種處理資料的新方式。公司的高層人員說,這賦予計算機類似想象的東西,他們希望這能幫助機器變得更為智慧。
實際上,Vicarious 也把賭注押在了目前熱門的人工智慧上。一些公司,如谷歌,Facebook,亞馬遜和微軟通過給龐大的神經網路灌輸大量的資料,即深度學習過程,已經在過去幾年裡取得了驚人的進步。比如,當深度學習系統被足夠的例子訓練過後,它就能以非常高的精確度,識別出特定的臉或者動物型別。但是,那些神經網路都僅僅是真實大腦內部所發現的(神經結構)的粗略近似。
Vicarious 採用了一種新的神經網路演算法,該演算法體現了更多生物上的特徵。它的一個重要特點是,在學習了一項資訊之後,它能夠預想這個資訊在其它情景中是什麼樣的——這是一種人造的想象方式。該公司的創始人認為,要使機器表現出更像人類的智慧,我們十分需要從根本上完全不同的設計。以後,計算機將不得不從更少的資料中學習,並能更輕鬆地識別刺激或者概念。
儘管在早期吸引了大量關注,但是 Vicarious 在過去幾年裡一直保持低調。但在今年,該公司表示,他們將會公佈他們研究的細節,並且承諾會展示一些令人瞠目的 demo,這些 demo 將展示給人們,電腦在擁有了想象後是多麼的有用。
Vicarious 公司總部看起來卻並不像人工智慧革命的中心。該公司的辦公室位於從帕洛阿爾託到舊金山灣的一小段車程處(我們被要求不透露其精確位置),該辦公室很平常——與一家麥當勞店只有一箭之遙,並且離一家牙醫診所也只有幾個臺階之遠。然而,公司內部卻充滿著高科技創業公司的活力氣息。當我拜訪的時候,十餘個工程師都正在努力工作著,其中幾個使用的是令人印象深刻的跑步機辦公桌。一些工程師的桌子上擺放著微軟的 Kinect 3-D感測器,該公司的 33 歲 CEO D. Scott Phoenix 以不無自豪地說:「我們正非常快速的接近我們所期望的計算能力,這種計算能力能夠(讓我們)在人工智慧上做一些有趣的事,」在我進來後不久,他告訴我。「15 年後,最快的計算機每秒處理的運算元,將會比所有人的腦神經運算元還要多。所以我們真的很接近了。」
然而,Vicarious 不僅僅致力於提高更多的計算機能力。Phoenix 說,Vicarious 創造的數學方法將會更加類似人類大腦的資訊處理過程。確實,目前應用在人工智慧中的神經網路,和真實大腦裡的神經元、樹突和突觸之間的相似度是極其有限的。
Phoenix 說,人工神經網路一個最明顯的不足是,資訊是單向流動的。「如果你在一個典型的神經網路裡看資訊流,它是一個前饋結構,」他說。「但是實際上,在大腦中,反饋連線比前饋連線還要多——所以,(目前的方法)丟失了一多半的資訊流。」
一個擁有想象力這個十分「人類」的能力的計算機,聽起來是十分神祕的。不可否認,光是考慮想象力可能成為人工智慧下一重大進步的關鍵,就已經十分誘人了。
Vicarious 已經證實,他們的方法能夠開發一個十分準確的視覺系統,且效果驚人。在 2013 年,這一系統已能夠破解 CAPTCHA(用於防止垃圾程式惡意註冊賬號的驗證圖片)。就像 Phoenix 解釋的那樣,嵌入 Vicarious 系統的這一反饋機制能讓其在圖片失真或者部分模糊的情況下,想象字元可能會是什麼樣的。
在一塊白板上,Phoenix 概括描述了系統核心方法的一些細節。但是更具體的細節依然保密,直到概述這一 CAPTCHA 方法的科學論文在今年晚些時候發表。
原理上,這個視覺系統可用於其他許多實際應用,比如更準確地識別架子上的目標,或者更智慧地識別現實世界的場景。公司的建立者們也表示,他們的方法能擴充套件到其他更為複雜的智慧領域,包括語言和邏輯推理。
Phoenix 說,公司可能會在今年晚些時候放出一部有關機器人的 Demo。確實,公司網站的招聘列表中有一些機器人專家的職位。現在的機器人,在挑揀不熟悉的、排列奇怪的、或者部分模糊的目標上表現不好,因為它們難以識別物件到底是什麼。「如果你去亞馬遜裝置那裡就能看到,大部分時間工人挑揀目標甚至都不帶看的,」他解釋說。「使用感官運用模擬器,他們在想象目標在那裡,以及想象手指會碰觸到目標的那個地方。」
Phoenix 是公司的領導者,其聯合創始人,Dileep George,是公司的技術規劃者。George 出生於印度,在史丹佛大學獲得電子工程博士學位。在博士研究即將結束的時候,他將注意力轉到了神經科學上。在 2005 年,他與 Jeff Hawkins 聯合創立了 Numenta 公司,後者是 Palm Computing 公司的創立者。但在 2010 年,George 離開了 Numenta,致力於踐行關於大腦資訊處理背後的數學原理的想法,同年,他與 Phonexi 創立了 Vicarious。
在我第一次造訪的時候,在電梯裡偶遇了 George。他是一個謙遜的、說話很靜的人,有著濃重的口音。但在極重要的事物上,他也相當的求證。
到目前為止,這一關於未來人工智慧的巨集偉藍圖已經幫助 Vicarious 獲得了令人驚奇的 7200 萬美元的融資。其投資者列表看起來也像是科技領域的名人錄。早期的資金來自於 Facebook 的前 CTO Dustin Moskovitz,以及 Quora 的聯合創始人 Adam D’Angelo。後來的基金來自於 Peter Thiel、Mark Zuckerberg、Jeff Bezos、和 Elon Musk。
很多人非常渴望看到的是,除了打敗 CAPTCHAs,Vicarious 還做了什麼。「如果他們今年能像我們展示一些新的東西,我會愛上它。」西雅圖艾倫人工智慧研究所的 CEO Oren Etzioni 表示。相比於谷歌、Facebook 、百度,Vicarious 還未發表任何論文,也未釋出研究人員能使用的工具。「(Vicarious的)人們非常棒,(他們研究的)問題也非常棒,」Etzioni 說,「但現在是時候拿些東西出來了。」
對於拿些投資了 Vicarious 的人來說,這家公司的巨集偉目標使等待是值得的。一家投資了 Vicarious 的投資公司 Data Collective 的合夥人 Matt Ocko 表示,即使這需要人們等待一段時間,但潛在的回報看起來是如此巨大,令人願意賭上一把。一個好的機器學習方法,可以應用於所有處理大資料的產業,他說。「Vicarious 的方法,是我目前見過的最可靠的。」
Ocko 還表示,Vicarious 已經證明,他們的研究成果能夠被商業化。「我們會十分謹慎地實現這一點,」他說。
試看今年 Vicarious 是否能夠藉助其論文和 demo,同樣激發其他人工智慧研究者和技術專家的信心。如果它真的做到了,Vicarious 能夠迅速從矽谷最熱門的團隊之一,發展為其成長最迅猛的企業。
這肯定也是該公司的創始人們希望看到的一件事。
但對於該公司,同樣存在質疑和批評的聲音,在 2013 年 Vicarious 受到廣泛關注之後,Yann Lecun 就公開表示謹防人工智慧炒作,認為它是教科書式的反面範例。不知接下來 Vicarious 的論文和 demo 是否能讓 LeCun 改變看法。
附:2013年 Yann LeCun 對 Vicarious 的評價:
人工智慧創業公司 Vicarious 聲稱它們的一個系統能解決 CAPTCHA(全自動區分計算機和人類的圖靈測試)問題,成功率達到「90%」。
謹防:這是一個人工智慧炒作教科書式的反面範例。
炒作對人工智慧而言非常的危險。在過去的 50 多年中,炒作四度殺死了人工智慧。人工智慧炒作必須要被制止。
可能 Vicarious 在自己構造的一些 CAPTCHA 資料集上,準確率能「升到 90%」。但是:
打破 CAPTCHAs 幾乎不是一個有趣的任務,除非你是一個垃圾廣告者。
在自己編造的資料集上,很容易就能獲得成功。其他人也能以同樣的方式超過你。
識別圖片上的物體,要比打破 CAPTCHAs 難的多。一些深度學習系統已經能夠相當精確地做到這一點。谷歌、百度都在開發這樣的系統。
對字串的同步分割、識別幾乎不算一個突破。在這裡你能看到一個(http://yann.lecun.com/exdb/lenet/index.html)20 多年前的demo。
悲哀的是,這一宣告被數個出版物發表,包括 MIT 科技評論、福布斯等。
這裡給科學/技術新聞記者提一個建議:千萬,千萬不要不要輕易相信人工智慧創業公司的模糊宣告,除非他們的最新成果已獲得可靠的行業標準的認可。
這一點在影象、語音識別等領域尤其重要,因為在這兩個領域存在非常好的標準。就影象識別而言,一個非常好的標準範例是 ImageNet 大規模視覺識別挑戰賽( ImageNet Large Scale Visual Recognition Challenge)。
當一個創業公司聲稱在一些隨機任務中達到「90% 準確率」時,不要認為這就具有新聞價值。如果一家公司還聲稱「我們正在開發基於人腦計算原則的機器學習軟體」或者使用「遞迴皮層網路(Recursive Cortical Network)」這樣華麗的名詞時,我們需要抱有更加懷疑的態度。
目前已有一些令人印象深刻的深度學習應用(例如,谷歌、百度、微軟、IBM、及其它一些創業公司),但(Vicarious)並不在此列。
谷歌的自動圖片標籤和百度的圖片檢索系統,要比這一宣告中的系統強大得多。就算只談字元識別,谷歌的 StreetView 用於識別房屋門牌號的系統,也要比這個更加矚目。
過去 50 多年,人工智慧曾因為炒作四度「死亡」:人們發表巨集偉的目標(通常是為了吸引潛在的投資者或資產公司)卻無法實現。然後負面影響隨之而來。這在神經網路上已經發生過兩次:一次在 60 年代末,一次在 90 年代中期。
不要再讓其再次發生。謹防炒作。
順帶一提,除了垃圾廣告者和電腦保安研究人員,沒有人對破解 CAPTCHAs 有興趣。這也是為什麼你找不到關於這一主題太多的計算機視覺論文的原因。這也是為什麼即使存在一個標準的資料集,也難以打破記錄的原因。