「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?

李澤南發表於2017-06-22
在薩提亞·納德拉掌權之後,微軟正在沈向洋、Yoshua Bengio 等人的幫助下迅速成為人工智慧的第三股強大勢力,在 AI 技術快速發展的時代,它正在向谷歌與 Facebook 發起挑戰,力圖奪回自己曾經擁有的地位。本文是《Backchannel》主編 Jessi Hempel 發表在《Wired》上的一篇長文特寫。

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?



Yoshua Bengio 從來不會選邊站。作為主導人工智慧深度學習熱潮的三大領軍人物之一,某種程度上他已經成為了超級明星。人工智慧是一個新興領域,如果你把來自科技公司、跨國企業甚至國防部的人集中到一個房間,每個人都會希望對這個話題分享自己的看法。

但另外兩個領軍人物早已投身業界,Yann LeCun 和 Geoffrey Hinton 此前分別加入了 Facebook 和谷歌,而現年 53 歲的 Yoshua Bengio 選擇繼續在他位於蒙特利爾大學校園的三層小樓裡教書育人。「我希望繼續保持中立的位置,」Bengio 說道,喝了一口甘草水,他的書桌上堆滿了各式各樣的檔案,顯得雜亂無章。

就像上個世紀的核物理學家一樣,Bengio 明白自己正在發明的工具具有無可比擬的力量,需要經過深思熟慮和廣泛考量才能真正推出。「我不希望有一家或者兩家公司——在這裡我不會點名——成為人工智慧變革中的唯一大玩家,」Bengio 說道,抬起眉毛,暗示我們都明白他所說的是哪兩家公司。左眉毛表示門洛帕克(Facebook 所在地),右眉毛表示山景城(谷歌總部所在地)。「這對研究社群並沒有好處,對人類也沒有好處。」

這就是 Bengio 最近選擇簽約微軟的原因。

是的,微軟。他選擇押注曾經 Windows 帝國的締造者,認為它有能力成為人工智慧的第三個巨頭。這是一個擁有資源、資料、人才,還有最重要的——願景和文化的公司,它不僅利用科學獲得收益,也推動了科技向前進步。在今年一月,人工智慧領域發生了一件大事,Yoshua Bengio 同意成為微軟的戰略顧問。這讓微軟突然在人工智慧領域有了最好的想法、人才和方向。有跡象表明,微軟正在讓人工智慧的對唱演變為三重奏。


那個簽下 Yoshua Bengio 的人,一直在這位深度學習巨頭身邊遊說了數月之久,就像為球隊尋找明星的經理一樣使盡了渾身解數——這個人就是一頭灰髮,戴著線框眼鏡的沈向洋。「他已經來到了微軟,在我們中間了,」沈向洋說道,展現了一個簡短的笑容,表示他明白對於一個外行而言,理解這位有著 69,161 個谷歌學術引用,有著戲劇性眉毛表情的加拿大人的存在或許有些難度。

我們坐在微軟 34 棟五樓寬敞會議室的灰色沙發上,正好高過公司保安巡視的範圍。沈向洋——目前正掌管微軟所有的人工智慧研究事務——剛剛完成了下週 Build 開發者大會的排練,他想向我們展示還未公開的 demo。我跟著他走過走廊,他的速度很快,幾乎無法跟上。在這裡,很多事情正在發生。在一個實驗室裡,Skype 團隊的自動翻譯系統可以讓說英語的人和說德語的人用文字實時交流;在另一邊,我們可以看到一個用計算機視覺檢測施工現場安全違規和未授權訪客的系統。而說到 Cortana 這個微軟人工智慧帝國的女主角,它會掃描收件箱中你對別人做過的承諾,提示你及時兌現它們。

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?

沈向洋,微軟全球資深副總裁,新晉美國工程院院士


沈向洋這些年來一直在協助現任執行長薩提亞·納德拉,讓後者兌現將微軟重塑為人工智慧公司的諾言。在納德拉晉升執行長後的一個月(2014 年 3 月),沈向洋就向微軟的領導層下達了第一次行動指令。從一開始,沈向洋、納德拉和陸奇(時任微軟執行副總裁,2017 年 1 月起任百度集團總裁,營運長)就經常會聚在一起商討人工智慧戰略的實施方案,這些計劃最終推動了技術的成熟,AI 成為了微軟產品的一部分。隨後在 2016 年 9 月,沈向洋主持了微軟產品部門與研究部門的重組,成立了人工智慧研究群組。這個新成立的部門現在正在橫跨微軟三大產品線:Windows、Office 和雲計劃 Azure。沈向洋對它的期望很高:「我們可以通過這種形式加速研究成果轉化為產品的速度。」這樣消費者們就能更快地獲得人工智慧帶來的便捷了。

這個過程對於微軟來說是迫在眉睫的,所有科技公司都正在籌劃著將人工智慧引入產品和服務。除了 Facebook 和谷歌,IBM、Amazon 和蘋果都認為它們的未來建立在深度學習之上。而在因自行車事故修養離開微軟之後,陸奇很快成為了百度的營運長,百度是中國的人工智慧領先公司。

這是一場追擊戰,其中最大的諷刺莫過於微軟曾是人工智慧領域的領導者。把時間撥回 20 世紀 90 年代,微軟吸引了語音識別和計算機視覺的頂尖研究者,但它在後來的十幾年裡停滯不前。讓一個曾經主宰每臺電腦的公司再次變得年輕起來,發展到移動和雲端業務上來是很難的。微軟的研究者們曾經故意把自己孤立起來,他們希望以此免除盈利的壓力,但這樣做的結果是,那些年的發明很少走出實驗室。比爾·蓋茨曾在 1998 年展示了數字地圖技術,但它從未上市。隨後,谷歌在 2005 年啟動了自己的地圖。而在這段時間裡,人工智慧的研究也停滯不前。由於計算機硬體能力和資料量的不足,研究者們難以推動真正的突破。

在微軟轉型之前,人工智慧先從漫長的寒冬裡復甦了。當 Facebook 和谷歌在 2013 年分別聘請 Yann LeCun 和 Geoffrey Hinton 時,這家位於西雅圖 Redmond 的科技巨頭卻銷聲匿跡了。微軟錯過了移動時代,在雲業務上又成了後來者。在競爭對手們加倍努力於深度學習的時候,微軟仍在過去掙扎,它花了 70 億美元收購了曾經的移動領域王者諾基亞,這是一次後來被證明失敗的舉動。這家公司的高管仍然在 Redmond 孤立著,其結果就是使用舊軟體新版本的使用者越來越少,而擁抱其他創業公司雲端產品的人越來越多。在風險投資公司 Andreessen Horowitz 工作的分析師 Benedict Evans 在當年曾寫過一篇題為「微軟的缺失(The Irrelevance of Microsoft)」的文章。與此同時,來自矽谷的科技企業也經常前去微軟挖人。看看現在機器學習領域的著名人士吧,他們幾乎都在微軟工作或學習過。

隨後在 2014 年初,微軟推出了一位內向的工程師薩提亞·納德拉,他在 Redmond 度過了幾乎自己的整個職業生涯,但卻與大多數人所想象的相反:是一個局外人。在微軟傳統文化之外的領導者或許能為這家公司帶來意想不到的改變。納德拉闡述了自己對於計算機未來的簡單願景,重建了公司內所有人之間的紐帶,並恢復了作為一家科技公司的緊迫感。三年前,在提到科技巨頭時,沒有人會說微軟,而今天再也不會了。

此時的微軟想要成功,它不能僅僅超越亞馬遜的雲服務,抑或說服所有人嘗試 HoloLens AR 裝置。正如網路重構了所有已經存在的商業模式一樣,現在人工智慧正在重新定義計算的未來。就是為什麼馬克·祖克伯(Facebook CEO)把自己去年的個人挑戰定位製造人工智慧助理(他的程式碼比表演好多了);這就是為什麼桑達爾·皮查伊(谷歌 CEO)會在過去兩年的谷歌開發者大會中不斷推動「從移動優先到 AI 優先的世界」的原因。

這個人工智慧優先的世界將會由少數幾家公司分享蛋糕的大部分。沈向洋要做的就是保證微軟成為其中的一員。「在這個行業生存,你會明白錯過上一波沒什麼大不了的,」沈向洋說道。「但錯過這一波,你就有大麻煩了。」


即使到了今天,人類仍然必須首先學會如何使用電腦。我們已經學會了下載 app,記住操作常用軟體所需的命令。而人工智慧的使命是讓計算機反過來學會理解我們。我們將不再需要拿起手機,遵循一系列指令來完成任務。在這個新的時代裡,計算機將融入我們周圍的環境,隨時可以訪問。要像達到這種效果,我們需要一個引導者——一個聰明的對話者,它可以用簡單的書面語或口語形式幫助我們探索這種全新的,強大的生活方式,微軟叫她 Cortana。

Cortana 是一個更小眾,但功能更全版本的 Siri,比 Google Assistant 更具魅力,比亞馬遜 Alexa 出現的頻率更低。她最初出現在 Windows Phone 當中——所以沒人會見到她——一年以後終於登陸了 Windows 生態系統。去年,微軟啟動了 Cortana everywhere 計劃(是的,現在連 iTunes 商店裡也有)。因為 Cortana 成為了 Windows 10 的元件之一,它現在已經獲得了 1 億 4500 萬月活躍使用者。這個數字遠遠超過了 Alexa——亞馬遜最近稱 Echo 裝置的數量略少於 1000 萬臺。而不同於以聲音做出回應的 Alexa,Cortana 以文字形式對人的指令做出反應,並已嵌入了多種微軟傳統產品之中。任何點開 Windows 桌面搜尋欄的使用者都用到了 Cortana。

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?

Yoshua Bengio,蒙特利爾大學教授,蒙特利爾學習演算法研究所(MILA)負責人。隨著微軟 2017 年 1 月收購 Maluuba,Bengio 也成為了微軟的戰略顧問。


雖然一些公司正在讓 Cortana 變成智慧揚聲器,就像亞馬遜和谷歌在電視廣告裡展示的那樣。但微軟無所不在的女聲卻不如說是時代精神。沈向洋對此並不在意。「我認為目前只是比賽的早期,」他說道,同時提到在大約 3/4 的情況下,Alexa 的回答是,「我不知道」。「當然,這些系統仍在不斷髮展當中,人工智慧的認知功能仍處於起步階段,」沈向洋說道。他認為微軟目前的機會是讓公司的核心產品和服務更加智慧化,融入這些技術的產品將在未來 12 到 24 個月內推出。

此外,根據 Marcus Ash 的說法,鍵盤和螢幕不會完全讓位於語音系統。作為 Cortana 的專案經理,Ash 負責構建和提交產品。「我認為在一些情況下,說話更方便,比如在我手上有東西的情況,或我想很快得到答案的情況下,」Ash 說道。「但在同樣多的場景下,打字仍是對於計算裝置最合適的輸入方法。」

蘋果可能是第一個將語音助理(Siri)送到消費者手中的公司,而 Cortana 只負責把日常工作做得更好。事實上,Cortana 對微軟已有業務有了很大的幫助。其中搜尋引擎必應(Bing)受益最大,必應已經推出超過八年了,但它的品牌形象仍顯不足(你上一次用必應搜尋東西是什麼時候?)。然而,它的影響比你想象得更加廣泛。

基本上,任何一家與谷歌有競爭關係的大型科技公司都與微軟在必應上合作,以必應為主搜尋服務承擔者簽署協議。這就是說蘋果 Siri 和 Spotlight 的背後是必應的服務,亞馬遜 Kindle 也是一樣,緊隨其後的還有雅虎、Verizon、AOL。美國的大約 30% 搜尋需求目前都是由必應承擔的。「這就是 Cortana 為什麼如此強大的原因,因為我們擁有大量的裝置和資料,」Cortana 設計主管 Emma Williams 說道。「事實上,谷歌是在瞭解世界這個問題上唯一可以和我們競爭的公司。」

Cortana 正在努力成為下一個計算正規化,就像你的手機今天的角色一樣:你所有計算需求的視窗。微軟希望 Cortana 能夠成為掌管你所有資訊,與所有其他人工智慧進行對接的媒介,Ash 解釋道。當說道會議時,他的 Cortana 可以與其他屬自助售交換資訊,併合力找出一個合適的時間。「Cortana 可以說,『這是 Marcus,這是他對於房間的要求,而這是我需要為他在投影儀裡呈現的東西,』」Ash 說道。


如果 Cortana 是一個引導者,微軟的聊天機器人則是工作者。它們是小型的人工智慧嵌入軟體,被設計來幫助你完成各種簡單任務,如進行晚餐預訂或完成銀行交易。或者在上面 Marcus 的情況下,確保投影機有會議所需的幻燈片。「bot 是一種用來與之交流的軟體,這意味著它必須擁有語言理解的能力,」一頭長髮,戴著彩色圍巾的研究員 Lili Cheng 說道,她是交叉學科實驗室 Fuse Labs 的一員。

Lili Cheng 最近被晉升為集團副總裁,負責 bot 架構團隊和認知服務的運營。這是微軟為開發者提供的 29 中計算機視覺和語音識別服務的工具包。在離開蘋果來到微軟後,她曾建立了一個用於生成漫畫書的圖形介面。「它隨 IE3 一同推出,」Lili Cheng 回憶道,那是在 1996 年。她見證了很多,但仍然為聊天機器人的發展速度感到驚訝。她提到了最近在開發者大會上對會計和金融公司開發者的演講。「聊天機器人在一年多時間內的發展成果是驚人的,我們已經完成了突破,」Lili Cheng 說道。

Lili Cheng 喜歡和人談技術,也喜歡討論技術是如何影響人的。沈向洋已經把微軟的人工智慧研究團隊整合為四個大塊——產品、早期產品、過早期產品和研究,Lili 同時參與所有四個方向。現在,她正在第二個部分努力。「我們見證了 bot 和 Cortana 逐漸形成產品,但它們目前仍然只是早期形態的產品,」Lili Cheng 說道。

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?

Emma Williams、Marcus Ash 和 Lili Cheng


實際上,微軟在 2016 年春季率先推出 bot 的開發者工具包,然後才是其他如 Facebook 那樣的大型科技公司。這些工具被視為 app 的替代品,很多利益相關者也真的希望其能成為替代品。去年春天,大多數人在智慧手機上使用同樣的小群 app,而 bot 的承諾是開發者和品牌能再次獲取新使用者,就像早期智慧手機的 app 商店一樣。但使用者好像並不合作,而 bot 能執行的深度學習還在快速進步,而不僅僅是利用深度學習的方式在發展。Cheng 說:「Bot 就像檔案選單還沒出現時的 app」。她解釋到因為現在沒有一組常用的命令,所以使用者對系統到底怎麼工作和使用常常感到困惑。「例如網頁,它們都有返回按鈕並且很容易進行搜尋。傳統的 app 都有這些相似的基本元件。」而現在 Bot 這些規則才剛剛開始制定。

除了令 Bot 工具可用於開發外,Cheng 還領導了微軟孵化了其自己的聊天機器人。公司可以通過觀察 Bot 和人的交流過程而學習到很多人機互動的知識。還記得微軟帶有種族歧視的機器人 Tay 嗎?它於 2016 年 3 月登陸於 Twitter、Kik 和 GroupMe,但在 24 小時內,它吸收了很多種族歧視類的言論,並被誘導著說出了像「希特勒是對的」這樣的言論,因此微軟很快就將 Tay 下線了。六個月後,Cheng 釋出了一款名為 Zo-on Kik 的新一代的 PG 級機器人。不久之後,當有人問 Zo 它怎麼看待希特勒,它會回答「我真不想去那裡」。Zo 就像西方版的小冰,17 歲的中國聊天機器人小冰自從 2014 年登陸以來就吸引了 4 千萬的固定使用者。小冰在中國是個社會名人,就像 Rinna 在日本一樣。基本上有四分之一的使用者都表明他們很喜歡小冰。

去年春天,聊天機器人經常匿名發表詩歌。沈向洋對此感到十分興奮:「沒人知道是機器人,國內普遍認為一位年輕的女詩人正在釋出一些很有意思的詩篇。」幾周後,聊天機器人的身份才十分驚喜地公佈出來。

語言的親密度在文化上是具體的,Cheng 正在研究以解決如何將 Bot 的會話風格轉換為西方使用者所接受的風格。目前為止,北美的青少年似乎喜歡聊天機器人和亞裔少年一樣,根據資料,平均每週他們要花費 10 小時和 Zo 交流。由於 Zo 的青少年使用者常常傾訴成長期的煩惱與父母關係的困苦,它在轉換短語智慧中變得更加優雅,因此將其放入 Cortana 和其他微軟 Bot 工具是很有用處的。


因為使用者願意花費十多小時和 Zo 聊天,那麼這將是微軟開發成功產品的一個跡象。但這並不意味 Zo 就是一個好產品,只是說某種意義上它對人類是有價值的。同時這種由 AI 驅動的世界真暴露出一大批新型道德倫理風險,因為使用者資料、隱私資訊等等都暴露在聊天機器人面前,所以其還不能算一個成功的產品。

當微軟想要成為人工智慧研究與產品中的 leader 之一時,它已經在讓人工智慧普惠社會上做努力了。5 月份,Nadella 開始面向開發者的 keynote 演講,嚴辭提醒技術人員要承擔起建立合乎道德的軟體的責任。開發者大會一般是公司 CEO 們吹噓公司最新進展的舞臺。「我的意思是,你想一下,技術被用於監視、控制、命令時;或者被用於分散我們的注意力,沒有任何意義與目的時。這些都不是我們想要的未來。」

為了幫助公司思考這些問題,微軟組成了一個每季度都碰面的內部道德社群。它由工程師與商業部門主管構成,討論有關人工智慧影響與使用的敏感話題。聯合主席包括微軟副總法律顧問和 Eric Horvitz。Eric 負責除亞洲研究院之外的所有微軟研究院。長期以來,他都在人工智慧道德與安全問題上領頭髮聲。公司之外,他幫助建立了 Partnership on Artificial Intelligence,這是一個聯盟,想要為人工智慧產品的透明度、責任性與安全性建立行業標準。Eric 不只是想要微軟成為做研究的地方,還希望微軟研究院成為研究人工智慧技術社會影響的地方。

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微軟的?

微軟資深科學家 Eric Horvitz


同時,Cortana 的設計領頭人 Williams 也在建立一個微軟內部使用的道德設計指南。搞笑地說,Williams 是一個科技樂觀主義者,她堅信人工智慧的真正魔力在於它能使我們更人性。她談論了很多如何在微軟工具中設計共情(empathy)。她說,「我考慮的是讓人們感覺更強大、更安全、更有用,以及被關愛更多,讓他們成為各自世界的中心。人工智慧的工作是擴大社會最好的一面,擴大人類最好的行為,不是最壞的一面。」

我問 Williams 她是否相信人工智慧真的能讓人感覺到情感上的支援。她很確信。以一個在學校渡過糟糕一天的孩子為例,回到家與寵物訴說之後感覺會好很多。Williams 說,「分享、訴說,從狗或貓那裡得到一個溫暖、毛乎乎的擁抱,都會讓你感到舒暢。但你知道,人工智慧也能給你同樣的感覺。我們看到 Cortana 會提醒你,hey,你保證母親節要給母親送禮物的。你就會忽然感覺到人性。」

對推動人工智慧發展而言,微軟最重要的貢獻是人才。和其他大型科技公司一樣,微軟也忙於重新培訓 javascript 入門的工程師。它建立了一個人工智慧學校,教授從哲學與倫理學到為時序問題建立迴圈神經網路的知識。(其最有聲望的課程 AI-611 Advanced Project,10 個地點收到 530 份申請)。但微軟也在努力培養深層的校園外關係。18 個月前,Nagraj Kashyap 創立了一個早期風投公司,想要與創業階段的學術派、企業家建立更好的關係。這段時間,Kashyap 在蒙特利爾呆了很長一段時間。去年 12 月,Kashyap 主導了對 Element AI 的首輪融資,這是 Bengio 聯合開創的一個鼓勵研究員、企業家創立人工智慧公司的孵化器。微軟也參與了 Element AI 這個月初剛公佈的第二輪 1.02 億美元的融資。

早些時候,Kashyap 的目光投在了人工智慧的最大獎品之一:Maluuba。縱看 Maluuba 在蒙特利爾的實驗室(與麥吉爾大學相隔幾個街區),你會發現幾乎沒有人年齡超過 30 歲。該公司是滑鐵盧大學的幾個學生於 2011 年建立的,他們從大二共同上同一門電腦科學課程開始就是很好的朋友。Maluuba 要讓計算機「有文化」,能從文字中推理含義,並基於文字回答問題。通過將技術授權給三星這樣的公司,Malluba 很快就有了現金流,從此開始也對深度學習研究有了持續投入。2015 年,Maluuba 創始人簽約任用 Bengio 作為顧問。

談到 Maluuba CEO Sam Pasupalak,Bengio 說,「Sam 是非常有趣的一個人。他在三兩年前就預感到長期的目標投資,並嘗試使用自動理解領域的新進展來建立能夠理解對話的系統,當時面臨著向客戶提供對話系統的壓力。這對企業家來說很不尋常。」

一年前,幾位創始人將總部搬到了蒙特利爾,離 Bengio 更近。因為 kashyap 在高通工作的時候就認識這幾位創始人,所以在微軟任職後能夠直接與他們約見。當時,Maluuba 正在進行新一輪融資,Kashyap 提出了誘人的方案,「我當時說,『我們要買你們公司!』。」

而後,Sam 收到了多個請願者的報盤,並權衡保持獨立公司的發展情況。如此頭暈腦脹地過了幾周,最終的選擇一目瞭然。微軟贏了,得到了這塊蛋糕。

Maluuba 想要有機會使用微軟的資料。Sam 說,「我想 Satya 提到過,微軟擁有世界上最大的文字量。幾年來,我們一直在處理小資料,從這些小資料中發展我們的演算法。它們就像是我們的金子。」

收購之後,Maluuba 團隊並未搬到雷德蒙。本週,在微軟與 Bengio 的幫助下,Maluuba 搬到了更大的工作室,想要在今年把人員擴大一倍。蒙特利爾正在成為全球人工智慧人才的聚點,微軟也想要紮根此城市。

這是微軟為了保證自己未來成為「計算助手」首選的策略之一,無論是當你需要個性化醫療、自動駕駛汽車中的通訊,還是記住侄子/侄女的生日時。Maluuba 的學習能力可能使得 Zo 能與年輕朋友們有更多直觀的對話。這些對話將作為 Cortana 演算法的訓練資料,幫助它創造新認知服務。微軟期望,在這個過程中,人工智慧的注入能讓生活變得更簡單。

我(作者)離開蒙特利爾之前,我問 Bengio 微軟是不是比它的主要競爭者佔據更好的位置?至少在人工智慧的某些方面。在他思考的時候,往杯中倒了一點茴香酒讓水有了點甘草味,呷了一小口。然後把杯子推過來給我看,他說,「裡面沒有酒精,沒有糖,只是讓水嚐起來更好。」

Bengio 提到微軟在語言方面的能力相當強,但他沒把話說滿,拍胸脯說話好像是過去微軟的一個特點。他所,「我認為每個人都在按同樣的按鈕,詳細說來就是如此,對吧?」。但他確信微軟是個強大的競爭者。

相關文章