沒有人懷疑Google在AI技術上領先 但它還需要學習蘋果做產品的本領

佚名發表於2016-10-08

  在兩天前舉行的釋出會上,Google 一改以前的技術公司風格釋出了 Pixel 手機、DayDream View VR 盒子、Google Home 等多款硬體裝置。但釋出會上,Google CEO Sundar Pichai 反覆提到的一個概念是 Google Assistant 智慧語音助手。和蘋果的 Siri 一樣,Google Assistant 已經嵌入了 Google 的幾乎每一款新發布硬體和軟體產品。

  這種轉變的背景是 Google 面臨的競爭環境的改變。Google,或者說它的母公司 Alphabet 目前是世界上市值第二高的公司,同時它也是搜尋、線上廣告、移動裝置等諸多領域的領頭羊。但去年剛上任 Google CEO 的 Sundar Pichai 面臨的問題卻是,這家公司雖然在技術上遙遙領先於其他大公司,但當需要把技術應用到產品中時,Google 卻拿不出類似於蘋果和亞馬遜那樣的成績。

  在桌面時代靠搜尋引擎起家的 Google 在移動網際網路成為主流之前靠 Android 系統成功地完成了一次轉型,這讓 Google 成為了一家“移動優先”的公司。但現在的情況卻是,網際網路不僅僅是從桌面轉移到移動裝置上,而是轉移到多種螢幕上,甚至是沒有螢幕的裝置都開始接入網際網路。對這個趨勢反應最靈敏的是亞馬遜,這家公司在 2014 年推出了沒有螢幕的智慧語音音響 Echo。當時很多人都認為 Amazon Echo 只是一個“雞肋”產品,因為看起來它的應用範圍實在是太小了。但現在,Echo 和它背後的智慧語音系統 Alexa 已經成了大公司們爭相模仿的物件,因為 Alexa 成為了很多家庭的智慧家居的控制者。

  於亞馬遜相比,Google 早就在語音識別、自然語言處理和機器學習等技術領域取得了領先地位。但 Google 唯一沒有做的就是像亞馬遜那樣早早地就把這些技術做成產品,讓它們去佔領消費者的家庭。

  或許是已經準備充分,或許是看到了對手們咄咄逼人的攻勢,Google 現在決定利用自己的優勢,並將其利用在產品上,包括軟體和硬體。而這個優勢就是人工智慧。

  在今年 4 月釋出的 Google 公司內部信裡,Pichai 說 Google 將由一家“移動優先”(mobile-first)的公司轉變為一家“人工智慧優先”(AI-first)的公司。“我們正在有意地把它應用於我們所有的產品,無論是搜尋、廣告、YouTube 還是 Google Play。我們還處於早期階段,但你將會看到我們在所有這些領域以系統性的方式運用機器學習。”Pichai 在 2015 年的一次電話會議上說。

  

google_io_pichai-e1464342232593

  Sundar Pichai

  和 10 年前的 mobile-first 一樣,Google 在人工智慧領域的殺手鐧也是開源,這一次 Google 開源的同樣是和 Android 地位相當的機器學習平臺 TensorFlow。TensorFlow 的魅力在於,它不僅在建立和訓練神經網路的速度上比以前快了 5 倍,還可以支援移動裝置、桌面、CPU、GPU和伺服器等多種平臺。

  開源的 TensorFlow 提供為開發者提供了完整的開發指南和文件,以及豐富的 API 介面,目前已經有 50 多款 Google 產品正在使用這個系統。

  最先受惠於機器學習系統的 Google 產品是 Gmail,該系統已經讓 Gmail 的垃圾郵件識別準確率達到了 99%。因為識別垃圾郵件本身就是一個典型的機器學習應用場景——分析越多垃圾郵件時,這些資料就會越來越增加機器學習系統的識別準確率,這是一個迴圈漸進的過程。

  但現在 TensorFlow 在電子郵箱裡能做的已經遠不止識別垃圾郵件了。在 Google 推出的面向企業使用者的 Inbox 郵箱裡,郵件會被自動歸類為重要、行程、財務、社交等標籤,而完成這一歸類的就是 TensorFlow 的機器學習系統。這和識別垃圾郵件的原理一樣,正確歸類越多郵件,系統的歸類準確率就越高,而 Gmail 和 Inbox 的使用者已經超過了 10 億,這給系統帶來了海量的資料。

  Inbox 還有一個“智慧回覆”的功能,它能讓系統閱讀你的郵件,併為你自動判斷可能會回覆的內容,你可以選擇回覆直接傳送給對方。這個系統本質上是一個遞迴神經網路,它能將你做出的選擇傳遞迴伺服器,當然沒有人能夠閱讀到這些內容。利用這些資料,系統就會慢慢“學會”如何更加智慧地回覆郵件。

  

20160607171147Z4NnmEiGODdXKrCo

  這一切都發生在 Google 總部園區的一座不起眼的兩層小樓裡,在這裡一個名為“Google Brain”(Google 大腦)的團隊正在竭盡全力將 Google 在人工智慧技術上的積累轉化為可用的產品。

  這個團隊成立於 2012 年,當時它的主要目標是進行一個深度學習和神經網路的研究實驗。現在這個實驗已經完成,但這個團隊保留了下來,並在 TensorFlow 創始人 Jeff Dean 的領導下在多個領域改善了 Google 產品的使用者體驗。

  Jeff Dean 曾透露,Google 目前已經有 100 個產品團隊正在使用機器學習技術,其中包括搜尋、Google Photos、Google Adwords 等。當然,其中最重要的就是這一次 Google 釋出會的主角 Google Assistant 智慧語音助手。Dean 說它旨在“開啟一個更自然、更智慧的人機互動模式,基於日常語言的使用。”

  現在 Google Assistant 已經出現在了 Google 的多款硬體裝置和軟體產品中,並且很有可能被開放給第三方開發者,這讓 Google 在語音助手領域可以與亞馬遜的 Alexa、蘋果的 Siri 和 微軟的 Cortana 展開正面競爭了。

  我們從昨天 Google 釋出的新產品中就可以看到 Google 的這一野心。例如 Google Pixel 手機的最大賣點就是搭載了 Google Assistant,它不僅讓 Pixel 手機實現了像 Siri 一樣的智慧語音回覆和任務處理,還在翻譯、影像識別上較以前的版本有了極大的提升。而智慧音響 Google Home 則幾乎是將 Google Assistant 變成了一個實體裝置,你可以讓它播放音樂、查詢天氣和安排日程。

  

gizmodo-02-Google-Assistant-1

  在軟體上,Google 著重推出的聊天應用 Allo 同樣內嵌了 Google Assistant,這讓 Allo 能夠實現智慧回覆、影像識別等功能。雖然 Google 的 Gmail 和 Inbox 擁有 10 億使用者,但電子郵箱對於年輕人來說實在是太古老了,因此 Allo 也成為了 Google 實現社交夢想的新一次嘗試。

  但 Allo 的智慧回覆功能使用的機器學習技術需要將使用者傳送的資訊傳送回 Google 的伺服器上進行演算法分析,並且 Google 會將這些資訊儲存一段時間。這一點遭到了愛德華·斯諾登的猛烈批評,他認為 Google 儲存這些資訊會導致使用者隱私洩露。

  在做社交產品時,蘋果也遇到了類似的隱私問題,但蘋果的做法更加尊重使用者隱私,那就是採取端對端的資訊傳輸和差分隱私技術(Differential Privacy)。這項技術會將使用者的資料切割成數個片段,並加入數學噪音隱藏使用者的個人資訊,然後這些加密的資料就會被上傳到蘋果的伺服器上用於訓練神經網路。這也能在使用者在使用一些本地知識庫中不存在的新詞彙時,讓系統更快地理解其意思,從而很好地提升了人機互動的體驗。

  能夠如此完美地兼顧機器學習對資料的需求和使用者隱私,是因為蘋果多年來在實際產品中得到的經驗。雖然不能說 Google 有多麼不尊重使用者隱私,但斯諾登的批評也不是沒有道理的。或許是 Google 內部的工程師佔據了主導地位,從而忽視了使用者對隱私的擔憂。但在急於將人工智慧推向使用者的過程中,Google 還需要像它的同行們學習很多。

相關文章