Geoffrey Hinton. (Michelle Siu)

Geoffrey Hinton. (Michelle Siu)

當谷歌的AlphaGo戰勝了人類頂級棋手,人工智慧開始更多進入大眾視野。無論是其深度應用還是可能存在的隱患,都是大家討論的話題。

即使是在科技大佬之間,觀點也存在截然相反的情況。馬斯克就曾表示 “我們會在智力上遠遠落後於AI,以至於最終成為AI的寵物。”在另外一方面,Alphabet董事長施密特則表示:“如果你擔心人工智慧在智商上超越人類、然後消滅人類,那你科幻電影一定是看多了。”

在日前,福布斯記者彼得·海伊(Peter High)對人工智慧教父傑弗裡·辛頓(Geoffrey Hinton)進行了專訪,他談到了很多關於人工智慧的看法。在他看來,神經網路正在向大腦靠近,AI的火爆不是因為其技術和原理,所謂的隱患更只是一個科技界的政治問題。他更是透露,AlphaGo擁有了直覺。

辛頓早在1970年代初期就開始從事人工智慧科研工作,是名副其實的AI先驅。曾先後供職於薩塞克斯大學(位於英國)、加利福尼亞大學聖地亞哥分校、劍橋大學、卡內基梅隆大學、以及倫敦大學學院,現任多倫多大學榮譽教授。他曾獲得過機器學習領域的加拿大國家研究大獎,該獎項為聯邦政府給予科學研究的最高榮譽及財務資助。2013年3月,辛頓的公司被谷歌收購,其也隨之加入谷歌。

以下為主要內容:

神經網路正向大腦靠攏

  海伊: 多倫多大學的資料上顯示,您一直致力於探尋一個高效的深度學習演算法,像人類習得知識一樣,能夠從一個龐大且多維的資料集合中梳理其複雜的結構。我想請您就這方面談談您的看法,還有您在多倫多大學和在谷歌的日常工作方面。

辛頓: 我們的大腦,毋庸置疑,非常擅於處理並理解多維的資料,例如從視覺神經傳來的資訊是百萬級權重的並且隨著時間極速變化的。我們每看到一個場景,大腦就能幫我們正確的解讀。如果我們看到的是一頭大象,那麼大腦不會把它解讀成一條狗。但是在實驗室中,我們的神經網路系統偶爾會理解出錯。雖然如此,在絕大多數情況下,我們的技術還是能夠準確的理解某個多維的輸入代表的意思。隨著該神經網路進行的學習次數的增加,正確率也會提高,這是傳統計算機所不能達到的,我們在向人類的大腦靠攏。這和單純的對低維度、少量訓練資料、引數不多的簡單模型從統計學角度進行資料探勘是有本質上的不同的。

大腦令我著迷的地方在於它所擁有的引數遠多於訓練資料,所以現階段的人工智慧網路還不能說非常成功。現階段我們能做到的是,我們的神經網路系統可以很好地處理百萬級權重以及百萬級訓練資料。有的時候,十億級也可以處理很好。但是我們的引數數量並不能像人類大腦那樣,遠遠超過訓練資料數量。對於每一秒的輸入,人類大腦大概有一萬個引數來處理。對於人腦這樣龐大的系統是如何工作的,以及它是怎樣分析資料的,我們目前所知還甚少。

海伊: 巨集觀的看,在人工智慧的發展歷程中,您覺得我們已經到達了什麼階段?

辛頓: 我覺得我們已經跨過了一個很重要的門檻。就在不久之前,AI領域的大部分從業者還在通過邏輯來處理AI技術。這種人工智慧還是基於邏輯推理的層面,對內部含義的表示採用的還是符號結構。現在我們擁有了這個龐大的神經網路,一切都改變了。我們現在的策略是,用巨大的向量來表示內部含義,而且也不再採用邏輯推理的方法。我們是讓這個巨大的神經網路自己學習,不再需要程式設計的介入。此前,人們覺得這簡直是天方夜譚。

舉個例子,拿一串英文字元及其對應的法文字元組成一對字串對,如果有足夠的字串對的話,神經網路系統就能夠自動習得這兩種語言,如果你給它一個英文句子,它能基本無誤的將這句英文轉化為法文。現在這項技術還不是很成熟,但是目前神經網路系統已經能夠掌握該方法的核心,只是在速度方面還有待改進,我相信很快該技術就能夠付諸實際應用了。20、30年以前的人會覺得這個想法太可笑了,要讓一個機器學習一門語言,你當然需要將大量的語義學,世界常識等資訊進行程式設計。如果僅憑一些資料,但這些資料並沒有包含該語言的實際知識,來讓機器完全憑空、傻瓜似的、自動地學習,這在當時聽起來有點可笑。現在,模仿神經網路這個概念被引進了,這個想法聽起來就沒有那麼可笑了,因為大腦就是這樣工作的。所以我說,我們已經跨過了一個很重要的門檻。現在大部分AI界的人,特別是年輕人,都相信如果你想讓一個系統獲得以百萬位元為計量單位的知識的話,最好的辦法就是讓它自己學,靠手動輸入是完成不了的。

海伊:所以說把邏輯推理的方式淘汰掉是因為你已經從這個瘋狂幻想的邊緣走到了技術的核心,而且這項技術也在發展且越來越規範。

辛頓:是的,在此之前我們之中的很多人都相信,如果有足夠的計算能力以及資料,那麼我們的設想就能實現,現在也確實實現了。現在我們的技術越來越成熟,如果能夠獲得更強的算力、更大的資料集合,那麼我們的模型也就能被不斷優化。這在一切都需要程式設計的時代是做不到的,所以神經網路系統比之前所有的AI演算法都更高階。

堅信人工智慧源於大腦的工作機理

  海伊:我覺得很神奇,你從1970年代就開始研究人工智慧了。你在1978年獲得了愛丁堡大學人工智慧方面的博士學位,並且由於當時計算機發展水平的限制,你的研究也受到了阻礙。這期間你也沒有對那些反對者多加解釋,哪怕他們可能會變成你的同事、投資人、或者可能會從其他方面幫助你。不知道現在這些研究人工智慧的20多歲的年輕人是否意識到,自己是站在巨人的肩膀上,而正是這些巨人才是真正有遠見卓識的人、排除掉這條路上所有阻礙的人。能不能談一下是什麼激勵著你,讓你拿到人工智慧的博士學位之後依然將這項研究作為你未來的職業發展方向,畢竟在當時,如果你從事人工智慧行業的話,成功的可能性並沒有現在這麼大。

辛頓: 我覺得原因是這樣的,大腦肯定有其工作的機理。大腦是怎麼學習東西的?它是怎樣利用那些簡單的神經元來運算極其複雜的事情的?我主要的動力來自於,我相信,大腦的執行機制和當時數字計算機的執行機制肯定是不一樣的,因為沒有人在給你的腦子程式設計。

我記得在1973年,當時有人跟我解釋,神經網路系統是永遠不會實現的。他們說:“神經網路沒法執行遞迴演算法。”那個時候,遞迴演算法被當作是智慧的本質。看起來我只能演示給他們看。所以我開始給他們展示,神經網路是如何進行真正的遞迴運算的。這裡真正的遞迴我指如何利用節點之間的連線強度來做一些事情。比如我們想要對這句話進行理解:John did not like Bill because he was rude to Mary. 要理解這裡面的從句部分“he was rude to Mary”,我們會用到將“He was rude to Mary. ”這句話作為獨立的句子理解時所用到的神經節點及連線。所以說我需要做的就是儲存當前進行到的位置,離開主句開始理解從句,然後再回來。我要對此進行展示,那麼我就要有這個神經網路系統,沒有它就做不成。所以我開始搭建這個可以做真正的遞迴的神經網路系統,通過在神經節點之前設立臨時權重來記錄節點資訊。我記得當時我跟我所在的科研小組提及過這個想法,但是他們不理解我為什麼要做這個事情。有趣的是,我當時想要攻破的難題,現如今變成了非常流行的技術。幾年之前,因為我們要探尋到底人類為什麼可以自主學習,這個問題就流行起來了。所以說人類花了四十年的時間才意識到,神經網路才是我們要攻克的難題。

多領域專家實現深度神經網路成果

  海伊: 你在2004年成立了神經計算與自適應感知(NCAP)專案,將電腦科學家、生物學家、電子工程師、神經系統科學家、物理學家和心理學家聚集到一起,複製人腦的執行機制。這件事需要很多學科的知識作為支撐。您能講講找到這些學科的世界級大師並且成立這個組織的故事嗎?

辛頓: 沒有人有必要是所有這些領域的專家,那太難了。你需要的是找到某個領域的專家,然後告訴他這個專案是什麼。這樣你就可以問他問題,省去了你翻閱資料的時間。例如你找到了一個神經系統科學家,你就可以問他諸如:“從一個點到另一個點有一個前向投影及其逆投影,那麼有多少個神經元參與了這個迴環?資訊要從多少個神經突觸間傳遞才能走完這個迴路回到初始點?”要想自己搞明白類似這種問題,那你需要很多的時間來查文獻,而且你不知道你正在查閱的文獻是否可信。如果你有一個專家幫忙的話,直接問他,他就會給你答案。所以團隊中有各個領域的專家是很必要的,能節省時間而且能少走彎路。

海伊: NCAP專案是邀請制的,所以說可能只有您和少數各學科的骨幹成員才知道,就像你剛才說的,你們都知道成立這個組織的好處,可以節省時間又可以和不同學科的人工作。您能談談建立起這個組織的過程嗎,您是如何兼顧在多倫多大學的教授工作以及在NCAP的研究的?

辛頓: 首先,我在建立NCAP的時候沒有想那麼多,我只是想到把我認識的所有能夠交流協作的人聚集到一起來做這個事情。選人的標準有三個:聰明、懂得交流協作、對神經系統是如何工作的這件事情感興趣。因為我已經從事這項研究很多年了,在這方面積累了不少人脈,當我們聚集到一起然後我們發現,哎,合作還很不錯。

海伊: 從2004年以來,計算機的的運算能力不斷增加,這肯定對您的研究有很大的幫助。那麼您覺得,當前NCAP的研究成果是什麼呢?

辛頓: NCAP目前已經有很多科研成果,不僅僅是神經網路方面,我們在共有的知覺與肌動控制領域也有研究。其中最具影響力的研究成果還屬深度神經網路。在2004年左右那個時候,業界普遍認為要訓練包含多層變數的神經網路是非常困難的,NCAP的大多數人也認為通過純粹的監督訓練是沒有辦法構建神經網路的。所以說接下來歷史的發展其實有一些偶然性,我們開始將著眼點放在非監督訓練上:如何在不知道整個網路應該輸出的正確結果的前提下,逐層進行訓練。每一層都在試圖為其下面一層的結構和資料建模,我們稱之為pre-training。這是一個能讓深度學習繼續發展下去的重要突破,有了這種技術,接下來深度神經網路的研究就容易多了。

後來人們就發現,如果有足夠的算力和資料支撐的話,深度神經網路的研究可以擺脫上述方式。很多時候你有很多資料,例如大段講話或者視覺資料,你就不需要pre-training了。但是pre-training確實是促使深度神經網路技術繼續發展的原因。我們是首先知道了通過pre-training可以解決瓶頸,然後再去尋求擺脫pre-training的方式。我覺得,是因為由NCAP最先提出來的pre-training引發了很多其他研究人員將其作為突破目標。

人工智慧火不是因為它的原理和技術

  海伊: 採訪了這麼多期人工智慧領域的領先人物,我發現讓我驚喜的是很多相對新的組織都將目光放得很長遠,制定戰略也都是基於長期的考慮,他們更傾向於選擇不期待短期回報的投資者。有很多組織將自己定位成非盈利機構,這樣能夠讓他們將技術的研發作為首要任務。這真的很少見,也很幸運,這麼多的頂尖人才紛紛將目標定在歷史發展而非短期盈利上。對此您是怎麼看的呢?

辛頓: 是的我有幾點想說。首先,不光有技術,還要有應用。現在神經網路這麼火不是因為它的原理,而是因為它真的可以做事情。像語音識別、物體識別、機器翻譯等這些應用都很震撼,人們也更樂意朝這方面投錢,來支援這方面的基礎研究。

我覺得,“以營利為目的”比“非營利”更加複雜,舉個例子,谷歌給大學投錢用來做基礎研究,這很好,對於大公司來說這非常重要。因為大學培養出來的高質量的畢業生可以為他們所用,所以大公司樂意投錢給大學做基礎研究,公司也能從其中受益,所以說其中的關係是很微妙的。

在大學裡面,有很多政治方面的壓力,在英國、美國、加拿大都有,這些政治壓力讓研究更偏向於應用。這樣政客花這筆錢有很好的理由:“我們投這筆錢是因為在五年之後就能回本,就能為社會提供工作機會,或者說五年之後就能盈利。”這不是做基礎研究的正常的路線。真正有價值的研究一定是出自於對未知的好奇。所以說給大學投錢做應用型研究在我看來是一個錯誤。我覺得大學就應該做基礎研究,應用方面應該由公司做。讓大學研究更傾向於應用的,這在自然科學領域是說不通的,是不對的。這只是對政客或者一些科學界的管理者來說是有利的,因為賣相好。

談谷歌人工智慧,AlphaGo有了知覺

  海伊: 現在您在學術界和應用界之間架起了橋樑,在您工作了多倫多大學任教的同時也加入了谷歌。我瞭解到你在多倫多大學的時間大概是從早上9:30到下午1:30,在谷歌辦公室的時間是2:00-6:00。兩邊都兼顧到了。能說說這兩份事業之間的聯絡與不同嗎?

辛頓: 我在谷歌的位置很特殊,我不再從事我之前從事的研究工作了。我在神經網路領域工作了很多年,所以我經歷了很多想法的產生與被否定。當時有很多想法被否定是因為計算機還不夠強大。我現在的工作是給谷歌神經網路團隊提供有可能會給他們現在的工作帶來啟發的舊的想法,用我多年以來形成的對於正確解決方法的靈敏的嗅覺來幫助他們做事情。現在我在做的是,為谷歌提供對於基礎研究具體可行的應用模式。這和大多數谷歌員工所從事的對於某一個應用的具體開發工作是不一樣的。在DeepMind部門(就是做出AlphaGo的那個部門),有很多員工做的事情就是發現新方法。在神經網路團隊,會有人專注於基礎科學的研究以及神經網路的新演算法的研發工作。

海伊: 您提到了DeepMind部門,在此前AlphaGo和李世石的圍棋對戰中被廣泛討論。您覺得這場對決的重要性在哪裡?標誌了現有的科研成果?吸引更多的人從事人工智慧研究或者開設公司?能談談您對這個問題的看法嗎?

辛頓: AlphaGo很有意思的事情是,它擁有一種普通計算機所沒有的東西,那就是直覺:觀察棋盤,然後選擇一個正確的地方落子。為什麼選擇這裡?因為感覺這裡對。這是神經系統和之前的以邏輯運算為基礎的人工智慧的不同之處,之前的人工智慧都太理性了。事實上,我們現在要做的是,逐步的將神經網路覆蓋到以前邏輯運算AI的應用範圍中去,因為我們現在已經擁有了有直覺的計算機。

人工智慧隱患的真正所在

海伊: 太棒了!很多投資人的投資引發了人們對人工智慧的安全問題的擔憂。人們想要確認隨著這一領域的發展,人工智慧帶來的隱患是否可以控制。您對於人工智慧為我們帶來的機遇和同時產生的隱患怎麼看?

辛頓: 我來拿挖掘機來做一個比喻,挖掘機在路上挖洞的速率遠比人工挖洞要快,與此同時,挖掘機也可以敲爆你的頭。很顯然,當人們設計挖掘機的時候就已經考慮到如何能夠控制它,不致於敲爆路人的頭。我覺得這在計算機領域也都是一樣的。我們在研發人工智慧的時候會考慮到什麼情況會發生意外,把所有會被居心叵測之人利用或者被誤用的可能性都考慮到。

很顯然所有的高科技都有可能被誤用,然而會不會被誤用,這取決於政策法規的限制。其實你害怕的是政客用人工智慧作為武器,所以我覺得這不是科技本身的問題。無論如何人工智慧行業都會繼續發展,會不會被用在對人類有利的地方,這取決於政策。就像自動應答機一樣,當時自動應答機出現的時候,很多銀行的員工因此丟了工作,他們當時肯定有怨言。但是現在再回頭看這件事,沒有人會說:“我們不該啟用自動應答機。”因為它的出現更方便,而且替代了簡單的重複工作。當時被替換掉的很多人也都找到了更有意思的工作。我覺得這和現在的情況是一樣的。