1458361735-6549-ib3eUZvloibXBibfTEEIqj237sxQ

DeepMind 在與李世石圍棋比賽中的勝利又激發了人們對人工智慧潛力的遐想。但是,谷歌這個名為 AlphaGo 的專案只是它很小一個計劃而已——甚至不是主要的那個。就像 DeepMind 聯合創始人 Demis Hassabis 所說,DeepMind 想去“解決智慧方面的問題”,而且對如何完成這一任務,他的辦法可不少。

為完成這一目標,Hassabis 自己有個不同尋常的成長路徑:作為一個在象棋方面堪稱神童的小朋友,他在智力運動會競賽中贏得總冠軍;之後,在很年輕時就憑藉開發出幾款電子遊戲在英國一舉成名;自然而然,他建立了自己工作室 Elixir;再之後,2005 年左右離開遊戲行業,在神經科學領域讀了一個博士學位,然後,他建立了 DeepMind。

在 AlphaGo 與李世石比賽的第一場勝利後,Hassabis 接受了 The Verge 訪問。在 Hassabis 想法裡,媒體這方面的事永遠排在最後,但當他走進房間時,還是很開心的樣子;而當有谷歌工作人員告訴他,昨晚有超過 3000 篇文章關注了 AlphaGo 比賽時,他表示了震驚。“這難以置信,對吧?”他說道:“看到這種有些深奧的東西變得受歡迎,這還挺有趣的。”

AlphaGo 外,對話還涉及到了視訊遊戲、下一代智慧手機助手、DeepMind 在谷歌中扮演的角色、機器人、AI 怎樣幫助科學研究等等。總之,這是一次深入的對話。

1,目前為止,對那些還不瞭解 AI 或圍棋是什麼的人,你如何從文化共鳴角度為他們描述昨天發生的一切?

圍棋堪稱是一種完全資訊博弈的巔峰之作,僅就可能性來說,它的複雜程度遠勝國際象棋,所以對自從“深藍”之後的 AI 研究,圍棋一直是一個重大挑戰。正如你所知,即使我們已經付出很大努力,但我們所走的路還是很有限。

蒙特卡羅樹搜尋是我們在 10 年前得到的一個重要創新,但我認為我們為 AlphaGo 所做的是為其引入了神經網路中的直覺部分,而這才是真正能成為頂級圍棋選手的條件:直覺。

當我看到麥克雷蒙在解說時也在計算目數時遇到困難,我覺得挺驚訝的,你要知道,他可是一位圍棋九段選手!而這也表明了想要為圍棋寫出一套“價值網路”體系有多困難。

2,AlphaGo 有下出任何讓你感到吃驚的行動嗎?

有。當 AlphaGo 穿越棋盤進入李世石佔優勢領地時,我們感到相當震驚,而且我認為從李世石面部表情看,他也很震驚。我認為那絕對是出乎所有人意料的一招。

3,是因為那代表了一種侵略性嗎?

也許是因為它的侵略性和膽大妄為吧。它在同李世石比賽中使用了李世石式下法。要知道,李世石就是以具有創造性戰鬥方式聞名於世,而這也是他昨天想展示出來的地方,我們對此也很期待。

從比賽一開始,佈局未穩時,他就幾乎在所有地方都展開了激戰。但傳統圍棋程式並不擅長這種下棋方式,他們在本地計算時也不差,但它們通常都缺少對整個棋盤的大局觀。

4,你們舉行這五場比賽目的就是要去評估 AlphaGo 能力,無論輸贏。你們從昨天比賽中得到了什麼?

我猜我們學到的就是我們要沿著這條路繼續向前走。你可以這樣說:這並沒有超出我們預期,但這也是我們所希望看到的。我們在賽前表示這場比賽勝負難料,大家都有 50% 機率獲勝。我仍然認為我們說的沒錯,任何事都可能發生,而我也知道李世石在今天比賽中一定會調整戰術。所以我對接下來的比賽仍充滿興趣。

讓我們來談談到 AI 意義。你也許聽我談起過 AlphaGo 和“深藍”間的差異,“深藍”是個手工操作程式,程式設計師需要將國際象棋大師們的資訊提取出來,將它們轉化成為具體規則和啟發;而 AlphaGo 則擁有更多學習能力,它能通過實踐和學習獲得成長,這是它更為人性的地方。

5,如果接下來的比賽繼續以這種 AlphaGo 取勝方式結束,你們下一步計劃是什麼?會在未來開發另一款 AI 對戰遊戲嗎?

我認為,對完全資訊博弈來說,圍棋已經是巔峰。當然,也許還有其他圍棋高手等著我們去挑戰。但對其他遊戲,比如沒有限制條件的撲克,那就非常困難了,因為那是一種不完全資訊博弈的遊戲。

而且也還有不少人類比計算機玩得好的專案,比如視訊遊戲,《星際爭霸》就是其中一例。這種策略類遊戲在資訊不完全世界中需要一種更高層級的戰略能力,也許我們可以稱之為“只觀察部分的情況”。而圍棋就沒那麼複雜,你能看到棋盤上的一切,因此,計算機玩起來會更容易一些。

6,挑戰《星際爭霸》是你自己感興趣的事嗎?

也許吧。我們只對在我們研究主軌道上的專案感興趣。因此,DeepMind 目的不是打遊戲、找樂子、取悅觀眾,雖然它能做到這一切。從我個人來說,我喜歡打遊戲,曾開發過電子遊戲,但我們主要是將遊戲作為一個測試平臺,以此,我們能試著去寫演算法、也能測算出它們架構和能力。總之,遊戲是個非常有效的測試方式。但最終,我們還是希望將其應用到現實生活。

7,我在 1990 年代末的英國長大,能看到不少電腦雜誌和許多電子遊戲,因此當我第一次見到 DeepMind 和你時,我想“你們可真是天生一對”,你之前在遊戲行業中的經驗和你現在所做的事有關聯嗎?

像 DeepMind 這樣的事一直是我終極目標,我為此計劃了 20 年。如果你始終觀察我在 AI 領域做的這些事,你會發現它們都有自己作用。如果你對我之前開發的那些遊戲有印象,你會知道 AI 就是我所做的所有事的核心。我們遊戲賣出了上百萬份,這是因為我們將 AI 融入到了人們玩的遊戲中。之後,我又回到校園中去學習神經科學,那是因為我感覺在 2005 年左右,我們應該在 AI 領域中走得更遠,但我當時卻還被要求去做遊戲,因為你的出版商們只想要遊戲。

8,是不是因為在那個時代,遊戲就是 AI 最顯著的應用領域?

我想是的,而且我認為我們當時所做的就是最頂尖的 AI 技術。我想說在當時,學術水平還停留在 90 年代,而這些新技術還沒真正得到普及,比如神經網路、深度學習等等。

因此,最好的 AI 技術就在遊戲領域。那不是現在這種學習型 AI 技術,它們都還是停留在有限狀態的機器,但已經很複雜了。像 Black & White 這樣的遊戲已經使用強化學習技術。

但在 2004、05 年時,遊戲行業發展方向已與 1990 年代大為不同,1990 年代的遊戲行業很有創造力、也很有趣,你能實踐你任何想法。但到 2005 年左右,人們都將注意力放在了影像及版權這些方向上,所以它就不那麼有趣了。我已為遊戲付出一切,而現在到為 DeepMind 做準備的時候了。而我選擇的方向就是神經科學,我想要從“大腦是如何解決問題”這個方向上獲得靈感,所以我想,還有什麼比去讀一個神經科學博士更好的方法呢?

9,本週你提到說 AI 未來應用領域將集中在醫療保健、智慧手機助手及機器人,讓我們來聊聊這些。為提升醫療保健水平,像 IBM 和 Watson 這樣的公司已開始有關癌症診斷方面工作,DeepMind 能帶來什麼呢?

目前它還處在初級階段。我們前幾周才和 NHS(英國國家醫療服務體系)展開合作,但那只是開始構建一個機器學習平臺而已。

在我理解中,Watson 和我們做的完全是兩碼事,他們做的更像是個專家系統,那是一種完全不一樣的 AI 樣式。我認為這種 AI 是通過影像去診療癌症,之後也許能縱向跟蹤你生命特徵,然後幫人們擁有一個更健康的生活方式。我認為這非常適合強化學習技術。

10,和 NHS 成為合作伙伴,你已經宣佈開發一個 App,但似乎沒有太多 AI 或機器學習技術。你們是怎麼想的?為什麼是 NHS 而不是其他人?

NHS 軟體系統在我看來就是一團糟,因此我想我們要做的第一步就是將其帶入 21 世紀。他們不是移動的,和消費者所理解的處理方式也完全不一樣,對醫護人員來說也非常糟糕。因此我想第一步,還是去幫他們使用更有效的工具,比如視覺化工具和基礎統計工具。我覺得我們已經做到這一點,之後我們會將更復雜的機器學習技術帶入其中。

11,讓我們再聊聊智慧手機助手吧。我發現你在當天演講中使用了電影《她》一張圖片,這難道就是最終結果嗎?

當然不是,我的意思是說《她》是現在主流觀點。我只是覺得我們想讓這些智慧手機助手變得智慧、能夠情境化,並可以對我們想做的事有一個更深理解。而目前,大多數系統還非常脆弱,一旦你使用他們沒預先程式設計的模板,他們就完全沒用了。所以這還是有關實用性、靈活性以及可靠性問題。

12,那你們需要什麼樣的突破以提升它?為什麼我們不能明天就用上它呢?

事實上是可以的,我只是覺得我們需要一種不同方式。再說一次,這是在預先程式設計和自我學習之間的對立,而目前幾乎所有智慧手機助手都採用的是預先程式設計方式,因此它們也非常脆弱,因為它們只能做已經程式設計好了的事。

但真實世界是非常複雜的,使用者會用你做許多你意想不到的事。而我們對 DeepMind 的堅信就在於這個基本原則:你研究智慧的唯一辦法,就是從根本性和普遍性上學習。

13,AlphaGo 成功的方法是學到許多不同遊戲模式,但這種方法如何應用到智慧手機中呢?畢竟人們向智慧手機輸入的內容五花八門。

我同意你的意見,因此資料量非常大,而你可以從中進行學習。事實上,我們將在接下來幾個月繼續調整 AlphaGo 演算法,我們認為我們可以擺脫監督式學習方式,能完全做到自我發揮,能從一張白紙成長起來。

這段路可能會很長,因為你需要測試和犯錯誤,所以也許我們需要幾個月。但我們覺得讓 AlphaGo 由純粹的自我學習成長起來是可能的。

14,這可能嗎?你們演算法已經達到這個程度了嗎?

不,我們可以在演算法沒達到之前就能完成。因為它不是開發出更強大程式,我們只是讓它使用純粹學習方法。我們認為目前這個演算法能在沒有監督情況下執行。

15,這會更容易嗎?比如它的失敗跡象會更明顯嗎?

會更容易,因為分數會變得更規則。在圍棋中,想要判斷你勝負,你只需得到一個分數就夠了,這被稱為所謂的“信用分配問題”,它的問題在於當你在圍棋中下了一百顆棋子後,你並不知道哪些是讓你贏、哪些是讓你輸了的,因此,判斷訊號會變得相當微弱。而在其他一些遊戲中,你所做的大多數舉動都能給你一個分數,因此你會有效仿的物件。

16,你能給出一個時間表嗎?何時人們才能在手機上見到這些變化?

接下來兩到三年中,人們就能見到這些變化。我的意思是,它的開始是很微妙的,只是讓某些方面變得更好了;但也許四到五年後,你就能開始看到一些大變化。

17,根據你所確定的未來可能性,這會是讓你們同谷歌連線起來成為一個整體的那一部分?

是的。

18,你有沒得到任何指示去讓你上面提到的這些技術契合到谷歌產品路線圖中?

沒有,對我們想要做的事,我們有自由選擇權。那就是我們的使命,也是我們選擇加入谷歌的原因,過去幾年它從未改變。

當然,我們也同許多谷歌內部產品一起工作,但還都在非常初級階段,因此谷歌還不想談論這些。智慧手機助手當然是我認為非常重要的核心部分,我也認為 Sundar Pichai 也已多次談論過將其作為谷歌未來發展核心了。

19,Google 自己也有一些創新部門,比如 Google Brain,它們也面向使用者推出像 Google Photos 這樣的機器學習產品。

這樣的產品到處都是。

20,你覺得你們和 Google Brain 有互動嗎?你們之間的工作有重疊地方嗎?

當然有,事實上我們是非常互補的部門,每週都有交流,Brain 主要關注在深度學習方面,他們也有像 Jeff Dean 這樣傑出的工程師,因此能融入到公司每個角落,這也是為什麼我們能見到 Google Photos 這樣優秀產品的原因。

他們目前正著手進行一項非常重要的工作,因為他們部門在 Moutain View,所以離產品部門更近,也有 12-18 個月不等的研究週期。而我們則更多關注在演算法開發,我們想要做的事通常時間週期都在兩到三年間,我們不需要在一開始就關注在產品上。

21,谷歌對 AlphaGo 的幫助大嗎?如果沒有他們,你能完成這項工作嗎?

谷歌的幫助當然很大。AlphaGo 在硬體上的執行要求並不大,但需要很多硬體設施去訓練它、去測試不同版本並在谷歌雲端進行比賽訓練。這些都對硬體設施有很高要求,因此我們不可能在沒有這些資源情況下、在這個時間範圍內完成它。

22,我駐紮在日本,這裡被認為是機器人的精神家園。我認為機器人目前在這個國家在兩個方向上被使用,Fanuc 這樣的公司製造工業化機器人,能在一個固定用途上做出令人驚訝的工作;而像軟銀 Pepper 這樣的公司則開發一些禮賓式機器人,他們很有野心卻又用途有限。你的想法是?

是的,就像你所說的 Fanuc 一樣,他們產品有很出色的身體機能,但缺少智慧。而那些禮賓式機器人則更像是智慧手機助手,都是使用模板進行預先程式設計那種樣式,如果你做了什麼他們無法理解的事,他們會非常困惑。

所以我猜目前最顯而易見的問題,就是像機器學習這樣的技術,如何才能推動機器人的能力發展。這是兩種完全不同的思路,我們人類從基礎上就擁有了學習新事物和應對突發事件的能力,而我認為這才是機器人或軟體在真實世界中所需具備的能力,他們也需要擁有正確使用這種能力的方法。我覺得機器人的學習路徑最終會走上正軌。

23,目前你能看到的最直接使用學習方法的機器人案例是哪個?

我還沒太想過這個問題。自動駕駛汽車會是其中一種,但他們目前使用 AI 場景太有限,儘管它們能在計算機視覺方面使用 AI 學習技術,Tesla 就使用了基於深度學習的計算機視覺技術。

我相信在日本肯定思考過不少這方面的事,比如能照顧老人的機器人,或是家庭清掃方向的機器人,它們都會在社會中非常有用,尤其是在一個人口老齡化問題嚴重的國家。

24,為什麼這種更加以學習為基礎的方法會對實際使用有這麼大幫助?

你只需去思考“為什麼我們還沒有這些東西”就好了。為什麼我們還沒一個能清掃家庭的機器人?就是因為我們每個人家裡都不同,比如佈置、傢俱之類,即使是你自己的房子,它每天狀況甚至都不同,有時很亂、有時又沒那麼亂。

因此,你不可能使用一個預先程式設計的辦法去解決你家庭清掃問題,並且在類似衣物摺疊這類問題上,你還會有自己喜好,這就更復雜了。我們覺得這些問題對人類沒什麼難的,但事實上我們所處理的是非常複雜的問題。

25,這只是一個個人好奇,你有機器人吸塵器嗎?

額…我們沒買,但它真的不是很好用…

26,我買了一個,它不是“特別”好用,但我發現我能學習到它那些怪癖並能與它一起工作,因為我很懶,而它所帶來的好處值得我付出這些。所以我很好奇:當我們擁有了更先進機器人時,那個“足夠好”的引爆點是哪個?我們會在它能達到有意義的人類層面的互動之前就停止前進嗎?

有可能。我想我們每個人都會去購買價格合理的機器人,因為它能處理垃圾、幫我們打掃衛生,無論如何,這些非常蠢的機器人確實很受歡迎,而它們也確實沒有任何智慧的地方。因此,我想我們所進的每一步都會是非常有用的。

27,你對未來人類、機器人與 AI 間的互動有什麼期待?很明顯,人們目前都在科幻小說中幻想美麗場景。

我自己並不會做太多機器人方面的想象,真正令我感興趣的還是 AI 在科學上的應用以及它的進步和發展。我想要看到 AI 助手在科學上幫助人類處理很多艱苦工作、檢索有趣的文章、在大量資料中發現相關結構、並協助那些真正能做出重大突破的人類科學家去工作。

幾個月前,我和歐洲粒子物理研究所有一場對話,很明顯他們創造出的資料比地球上任何人都要多,而我們都知道可能有新粒子就躺在那些海量的硬碟中,但沒有人能夠分析出它們,因為資料實在是太多。因此,我想如果有一天 AI 能參與到發現新粒子過程中去,那會是非常酷的一件事。

來自:極客公園