微軟為何要押寶人工智慧?納德拉想讓公司超越谷歌

佚名發表於2016-07-11

美國科技部落格The Verge近日釋出了署名為凱西・牛頓(Casey Newton)的文章,文章對微軟為何將未來押寶在人工智慧(AI)方面進行了闡述與分析。以下就是這篇文章的主要內容。

微軟為何要押寶人工智慧?納德拉想讓公司超越谷歌
人工智慧(AI)

薩蒂亞・納德拉(Satya Nadella)一踏進會議室,就開始急切地談論智慧問題。我有幸到微軟總部,聽納德拉談論微軟公司在打造更多智慧應用和服務等方面的進展情況。納德拉告訴我,每天早上,他都會戴上HoloLens全息眼鏡,這款眼鏡能夠讓他看到投影到自家牆壁上的虛擬現實、互動日曆等內容。納德拉在描述這些情況時,顯得眉飛色舞。這套系統是非常智慧的、具有生產力的,也是未來派的,納德拉希望一切都將掌控在他的領導之下。

微軟為何要押寶人工智慧?納德拉想讓公司超越谷歌
微軟CEO:納德拉

納德拉表示,無論我們將來在哪兒工作,微軟都將會在其中擁有一席之地。微軟公司於今年三月展現的“對話即平臺”(Conversation as a platform)戰略,就體現了該公司在豪賭一項業務——基於聊天的互動介面將取代應用作為我們使用網際網路的主要方式,未來使用者將使用新的聊天介面來查詢資訊、購物、使用其它服務。與此同時,由於微軟推廣的“認知APIs”的推動,應用也將更加智慧。未來,微軟所使用的這種“認知APIs”將能夠識別照片和影片中的人臉、表情以及包含的其它資訊。

微軟認為,經過近二十年在機器學習和自然語言處理方面的進展,該公司已經擁有最好的“大腦”,可以幫助該公司締造一個由人工智慧支援的美好未來。微軟在打造能夠與使用者進行情感共鳴的智慧裝置方面已經取得領先地位,並率先在中國市場進行了影片測試。在科技行業各個大公司中,微軟是第一家針對文字聊天介面而釋出真正平臺的公司,這也是微軟引以為豪的地方,特別是在智慧手機的崛起導致多數此類業務下滑的情況之下。

移動業務受挫之後,微軟還能打贏下一場戰爭嗎?

今年1月,The Verge曾釋出文章描述了科技行業尋找殺手級智慧裝置的訊息。在之後的幾個月中,業界大小公司都加快在此方面的努力措施。Facebook啟動了自己的智慧聊天裝置研發平臺,搭載其具有人氣的Messenger聊天應用。谷歌(微博)也宣佈了自己的新智慧助手,代號為“Allo”,而且還將推出一款智慧對話應用“Home”,與亞馬遜的Echo展開競爭。與此同時,Echo的語音輸入資訊功能已經吸引了不少開發者,這款產品也已經入駐300多萬家庭,而且還透過其API增加了1200多個“技能”。

微軟對自身在API方面的工作感到非常滿意,並急切地希望表明該公司在這一方面的競爭中必將最終勝出。今年6月,微軟邀請我到該公司的園區,採訪納德拉的一些高階幕僚,這些高階幕僚正在幫助把人工智慧融入到微軟業務的每一個角落。在之後的兩天中,微軟向我展示了在自然語言處理和機器學習方面取得進展的大量應用。

與以往一樣,微軟公司這次還是熱情洋溢地講述了該公司的進展和遠景目標。微軟此前在判斷科技行業的走向方面一直有著較高的水準,但是,在針對科技行業發展趨勢而採取行動方面,微軟則出現了一些失誤之處。例如,微軟要比業界同行更早地看到了智慧手機平板電腦的巨大潛力,但在最終的產品開方發,微軟卻在蘋果和谷歌面前一敗塗地。因此,面對微軟在人工智慧方面所採取的積極措施,業界免不了產生了這樣一個疑問:微軟公司這次怎麼不走尋常路了?

或許,與美國的任何一家公司相比,微軟在打造聊天機器和軟體方面已經取得了更多的成功。但是,人們可能對此毫不知情,因為微軟的這一成功始於中國市場。

2016年1月,微軟的一位人工智慧產品出現在上海東方衛視的早間新聞當中。當時,東方衛視在播放天氣預報時,就利用微軟小冰提綱主持人,取得了較大的成功。

如果你想知道,微軟為何能夠在聊天機器人方面擁有如此驕人的成績,那麼“小冰”就是最好的一個答案。微軟必應搜尋工程業務主管德里克・康奈爾(Derrick Connell)表示,“現在我還不敢說我們已經研發出殺手級的聊天應用——但是,我們已經找到了一款聊天應用,這款應用以一種全新的方式工作,能夠實現諸多的對話潛力。”

2014年,微軟曾透過中國的訊息應用“微信”推出了“小冰”。小冰能夠回答一些簡單的問題,這有點像微軟的虛擬現實助手Cortana。但是,小冰比Cortana更加出色的地方就是對話功能。這個智慧聊天裝置對情緒非常敏感,而且還能夠記住使用者此前的聊天情況,並主動與使用者進行互動聊天。

在使用了三天之後,小冰就得到了業界的廣泛關注,不僅成為微信使用者廣泛議論的話題之一,而且還吸引了中國大量微博使用者的關注。在中國市場,小冰也成了最具人氣的名人帳號。如今,這款智慧聊天應用已經被4000多萬使用者使用,使用者與這款應用之間的平均每次對話約有26個回合。

對康奈爾而言,小冰也為推進下一代搜尋服務指明瞭方向。傳統的網路搜尋會反饋一個網頁,給使用者提供所需的搜尋結果,然而,這個更加完美的對話機器人應用可能會透過語音這種簡單的回答方式給使用者提供他們所需的答案。

當然,微軟智慧聊天應用在中國市場的成功並不一定表明其也能在美國市場取得成功。例如,微軟在美國市場推出的首款英語聊天機器人“Tay”,在與使用者的聊天試驗中表現非常糟糕,並最終徹底失敗。如今,小冰距離最初亮相已有兩年的時間了,然而,這款智慧聊天機器人卻仍不具備同等的英語聊天能力,而且近期可能也不會得到大幅改進。不過,微軟高管聲稱,小冰背後的基礎架構卻表明該公司在此方面有著大量的機會。

“我們想讓它成為一個生態系統”

康奈爾表示,“這是一個現代化的時代——使用者不需要成為演講和理解語言方面的專家。只要使用一款工具,用我們的工具打造自己的智慧聊天裝置,並將其放到相應的場景之中——可能在‘Slack’應用上,也可能在‘Facebook Messenger’應用上,我們還希望是在Skype或Windows之上,所有的這一切都依賴使用者自己的選擇。”

不過,開發者也越來越擔心,有關智慧聊天機器人的標準之爭也將激烈展開,為此,微軟也非同尋常地開展了外交活動。今年6月,微軟在舊金山組織了一次會議,倡導智慧聊天應用製造商之間開展更多的合作。微軟高階工程師程莉莉(Lili Cheng)幫助組織了此次為期兩天的會議,她表示,“我們對智慧聊天裝置的可互操作性非常感興趣,我們希望這是一個生態系統。今後極有可能的情況是,我們需要找到各方合作面臨的問題和挑戰,並齊心協力加以解決。”

透過主導智慧聊天裝置為主題的會議,微軟希望,在向智慧聊天機器裝置轉型的過程中,能夠以此來鞏固自身的核心地位。如果微軟取得成功的話,那麼它將在移動領域擁有全新的開端。微軟技術所支援的智慧聊天機器裝置能夠從內部展現世界最具人氣的訊息應用的各種情況,從而讓微軟在這個全新的領域獲得立足的堅實基礎。

戰略

當然,微軟單獨在嘗試打造下一代計算的限定性平臺——如果人機對話需要那樣的平臺。事實上,各家大科技公司以及大量的初創企業都建立了自己的人工智慧部門,而且也都取得了令人印象深刻的結果。但是,值得指出的是,將各個公司的人工智慧業務進行比較,還是非常困難的,甚至是不可能的。像谷歌、Facebook以及亞馬遜等公司仍在研發一些未釋出的人工智慧業務。相關公司的高管在被問及使用者什麼標準來區分人工智慧或者是他們的人工智慧有什麼顯著特點等 問題時,他們的回答總是含糊其辭。例如,谷歌執行長桑達・皮查伊(Sundar Pichai)只是簡單地表示,“很長一段時間以來,該公司一直在研發人工智慧。”

風投公司Andreessen Horowitz的未來主義人物本尼迪克特・埃文斯(Benedict Evans)近期透過部落格稱,人工智慧的未來仍然非常模糊。埃文斯在部落格中表示,“這一領域迅速發展,以致於很難弄清最強的領導者到底在哪兒,哪些產品會成為主流,以及各個產品的主要區別到底是在哪兒,目前也都很難說清楚。儘管與這些技能相關的主要電腦科學已經問世,而且也是開放源學科,但是,真正的執行卻遇到了不少問題,因此,事實上,這些技能仍然沒有真正地轉化為產品。”

負責公司應用與服務團隊的微軟高管陸奇(Qi Lu)表示,就微軟的競爭優勢而言,他感到非常滿意。陸奇也是一位電腦科學博士,名下已經擁有20多項專利。我從與他同行的對話中瞭解到,他也備受同行們的尊敬。在交流了一段時間之後,我終於發現其中的原因了——他是一個非常具有才智的人。我們會見時,他穿著涼鞋,配著襪子,身著短褲和T恤,T恤衫上寫著一句話——“做偉大的事情”。

陸奇開始總結第一波移動網際網路帶來的不利局面。他稱,來自移動裝置的網路流量比值一直沒有超過臺式裝置,這反映了使用者對移動網際網路的一種失落感。陸奇表示,“我們知道網路並非真正地是在手機上有效。”從很大程度上來說,使用者似乎不願意下載應用。西雅圖的居民可能會被要求下載某一款應用,目的只是為了要檢查一下他們多次乘坐的渡輪的票價情況——當然,應用會有更好的模式。陸奇又表示,“我們的行業一直沒有發現一個能夠展示移動和雲端計算完整價值的體驗平臺。從根本上而言,應用並非正確的模式。”

應用只是以代替基於HTML的網路的互動介面而崛起,因為應用是我們此時能夠做得好好的方式。你可能無法透過語音的方式將你從網際網路上獲得的內容輸入到手機當中,於是,開發者打造了成熟的隱藏式產品,從而讓你透過巨大的圖形按鈕來與手機進行互動。這種按鈕仍然是完成諸多工的最有效途徑。但是,由於自然語言處理技術的進步,如今你們也真正能夠透過語音方式將從網際網路上獲得的內容輸入到手機之中。陸奇聲稱,下一代“體驗平臺”就將從那裡起步,就透過人機對話開始。這將更加自然地與人類的一切行為方式相融合。而且,如果使用者做對的話,那他們就可以充分利用各種按鈕。陸奇還稱,“我們已經看到使用者在全方位地將語言當作一種基本方式來改善這種體驗,而且還以更加成熟的方式使用圖形互動功能。”

陸奇還表示,對企業而言,要想在這些領域取勝的話,還需要五大“關鍵要素”。第一大要素就是“對話場景”——在這裡,使用者可以進行大量的對話和文字訊息進行交流。在這方面,微軟擁有Office、Outlook、Skype以及Cortana等。第二個要素就是人工智慧“大腦”——這是一種非常成熟的大腦模式,微軟聲稱其自己的人工智慧措施可以追溯到20年之前。第三個要素就是要能利用社交圖譜——人們在網際網路上的活動往往涉及他們的好友和同事。並非巧合的是,在我會見了陸奇後的幾天,微軟宣佈該公司將斥資262億美元收購LinkedIn及LinkedIn的4.33億註冊使用者。第四個要素就是能夠操作人工智慧業務的平臺。微軟擁有Windows和一系列類似裝置,特別是Xbox。最後一大要素就是渴望在你平臺上打造應用以及願意為購買優先權而向你付費的開發者網路。激發開發者在此方面的興趣也一直是今年三月份微軟Build開發者大會的主要目標。

單從其中的某一個要素來看,微軟也面臨著強勁的競爭對手。事實上,Facebook就擁有更加強大的人機對話場景,而且還具有自主研發的大量訊息應用,同時該公司還擁有最大的社交圖譜。谷歌的“大腦”或許更加智慧,而且谷歌還能夠接觸到數億部Android裝置。不過,就總體情況而言,微軟似乎要樂觀得多。對此,陸奇表示,“把所有的要素加起來,我認為,我們完全擁有主導未來的實力。”

“大腦”

微軟全力支援人工智慧早在兩年前的年度就已經開始了。在當時召開的Code Conference大會上,剛剛擔任微軟執行長三個月的納德拉登臺演講,闡述了微軟的未來遠景。納德拉在演講結束之際,展示了Skype的一些功能。隨後,另外兩名微軟員工也登臺演講,一位講英語,一位講德語,而Skype則實時翻譯他們的演講內容,從而讓他們無障礙地與聽眾互動。這樣的展示給業界留下了深刻的印象——就在當年底,納德拉宣佈這將成為一件工作產品。

在返回微軟總部之後,納德拉就對Skype研發團隊下達了命令,要求儘快將此產品推向市場。負責微軟研究業務的企業副總裁彼得・李(Peter Lee)表示,“對我而言,這的確是一個大意外。薩蒂亞的確是用這個Skype Translator把我套牢了。”最初,研發團隊一直存在兩大擔憂。其一是,微軟研究團隊歷史上一直沒有將產品推向市場的任務,研究人員擔心,他們會因此而突然沒有什麼自由來追尋科學上的突破與進展。其二是,在展示時,Skype Translator表現不太好。微軟公司的語言模式一直是使用大量正式的演講內容來測試——例如來自聯合國的演講內容等。但是,Skype需要用來翻譯的這種雙軌式交流卻大不相同。當然,Skype在翻譯時還存在更多的“不流暢”局面——特別是當發言者說錯某個詞時,或者重複某句話時。另外還會出現“程式設計混亂”的情況——當發言者在一個句子中使用多種語言時。此外,當人們相互對話出現嘈雜之音時,Skype Translator在翻譯時就顯得非常困難。

彼得・李還表示,“從根本上看,一切仍無濟於事。我們需要做的就是重新對各種模式進行訓練。”但是,李的團隊似乎受到了納德拉的鼓舞,於當年12月就推出了預覽版的產品。第二年,這款產品就廣泛的投放到市場,供使用者免費使用。彼得・李一度將納德拉稱為“激進人士”,他聲稱,此專案最終還是非常令人振奮。李表示,“試想一下,當你認為所有的一切都毫無作用的時候,你可能會士氣低落,而且感到恐懼,但是,你不得不讓人們相信這個產品。當你努力這樣做的時候,你就會看到令人振奮的新事物隨之而來。”

這種說法感覺上並不誇張。微軟如今能夠將八種不同語言之間的相互對話(相當於56組對話)翻譯出來,其背後的技術影響力已經超越了翻譯本身。你想聽聽一個具有令人難以置信的作用的智慧聊天裝置說話嗎?微軟正在測試記錄商業會議內容並能夠實時整理內容文稿的軟體。也就是說,同樣的軟體也能夠記錄兩人之間的採訪聲音內容,並整理出相關的文稿,或許,這將成為任何記者都非常向往的技術產品。

李表示,“無法向你們描述,當我們最初研發時發現Skype Translator的一切工作都無濟於事的,我們是何等悲傷。但如今,我們正在攀登高峰,我們正在發展這些演講和翻譯模型,特別演講模型——他們好得出奇。

“Clippy的復仇”(編注:此理念源自《灣區日報》上一篇不錯的概述聊天應用發展前景以及以聊天應用為平臺的創業觀點的文章)

與此同時,微軟還將大量的人工智慧資源注入公司旗下的一些重大產品之中,例如Windows和Office等。人工智慧的一大潛力就是,它能夠預測使用者的需求——這也是Google Now的主要創意。Google Now能夠在使用者開啟手機時向使用者提供交通、天氣、化育賽事的比分等資訊。

微軟正在努力將類似的人工智慧整合到臺式產品之中。負責Cortana研發的馬庫斯・阿什(Marcus Ash)向我展示了一款模仿版的Windows,此係統能夠在基於雲的介面上繪製出我可能想要知道的東西。當阿什接觸啟動選單之後,Cortana就顯示出一系列建議行動:對你有意義的姓名、你近期使用過的文件、建議翻譯的普通法語單詞等。在使用者的許可之下,Cortana將整合使用者聯絡人、網路搜尋歷史以及應用使用情況等相關的資料資訊,並給出相應的建議。

而且這還會隨著每天的時間而變化——例如,應用開發者能夠預測這些應用是在上午還是在晚餐時間發揮作用。對此,阿什表示,“這種利用人機對話、以及在使用者許可下利用與使用者相關資訊來讓使用者更加有效開展行動的創意,感覺就像是使用者被控制了一樣,然而這恰恰就是我們真正為之高興的東西。大量的使用者體驗工作日趨簡化,而且取消了各種限制,並能夠真正地向人們展示智力的力量。”

阿什最喜歡的一大事例就是所謂的“承諾”。在得到你的許可之後,Outlook就可以記錄你的老闆要求你在週末之前給她送什麼東西等之類的事實——而且,如果你未能及時做到的話,它還會自動提醒你。阿什表示,“我的生活非常忙亂,我總是健忘——特別是忘記處理電子郵件。”最近,他就忘記給他們自己的老闆提出的要求進行回覆,但幸好,Cortana及時通知他處理了這件事。

當我會見微軟負責Office營銷業務的企業副總裁科克・科尼格斯鮑爾(Kirk Koenigsbauer)時,我看到更多類似的情況。他向我展示了各種智慧讓Office更加便於操作的方法。2014年9月,微軟推出了Delve,這是一款內建在Office 365中的便捷工具,有點類似於Fitbit的功能。這款應用能夠分析使用者花費在電子郵件上面的時長,以及開會的時長,而且還能夠在使用者的日曆上突出顯示使用者從事更加複雜更有意義工作的時間和加班時長,甚至是完成工作的速度。這款應用 將建議使用者與一段時間一直沒有電子郵件往來的同事們進行聯絡。此外,這款應用甚至還會向使用者顯示同事以及自己回覆電子郵件的時間。

如果使用者組建群使用者共同使用谷歌應用,就像矽谷許多公司那樣,那麼,瀏覽Delve時可能就會有意外的發現。你沒有必要再像一個數字書呆子那樣尋找這類有用的資訊。如果你是一個經理,那麼Delve就能夠提供你看一眼你過去一週花在每位員工身上的時間有多長。這種智慧不一定像能夠預期使用者需求的那種人工智慧那樣好,但是,它也能夠起到它應有的作用,透過比較,而且還會讓谷歌應用看上去就像是一個可以忽略的東西。

經過六個月的搜尋殺手級智慧聊天裝置之後,我仍然對這一概念持有非常樂觀的態度。這種智慧裝置所能進行的互動量非常大。不過,我一直對我們能夠在Facebook Messenger和Telegram等平臺上看到諸多內容感到失望:每次我總感覺到這可能是使用網際網路的最慢方式了。如今,圍繞智慧聊天應用和人工智慧的討論仍然受到業界打造可盈利新平臺的願望所驅使,而不是這些服務到底能在多大程度上滿足消費者的需求。

一些公司目前為止針對這一問題的答覆一直是,他們已經在研發滿足消費者需求的應用。Facebook技術長邁克・斯科洛普夫(Mike Schroepfer)表示,“與諸多先進的技術一樣,人們認為這種智慧技術如今已經出現。事實上,還有許多的技術和工作需要研發。我認為,日復一日,年復一年,我們肯定能夠在這些方面取得進步。”

相關文章