市場研究公司Gartner最近發表報告預測,到2020年,人們與智慧手機近半數的互動將通過、微軟Cortana和谷歌GoogleNow等語音助手完成。
Gartner稱,“到2020年,智慧代理將完成40%的手機互動,智慧代理將在後應用時代佔有主導地位。以語音助手形式出現的智慧代理技術,將與基於雲端計算的神經網路監測使用者內容和行為,以建立和維持資料模型。根據這些資訊收集和建模努力,語音助手能預測使用者的需求,建立信任,並代表使用者執行動作。”
使手機能預測使用者需要的資訊、需要資訊的時間,已經成為各大科技公司的努力方向。各家公司在擴充套件語音助手方面取得了重大進展。
蘋果Siri
在被發現涉足神經網路領域後,去年蘋果受到廣泛關注。神經網路技術會使Siri更智慧。
蘋果最近一系列的收購會使Siri更上一層樓。10月,蘋果收購了自然語言語音識別技術公司VocalIQ,後者的技術有助於提高Siri理解使用者語義的能力。蘋果最近還收購了深度學習技術廠商Perceptio,其人工智慧技術不需要收集大量的使用者資料。Perceptio在開發能對照片分類的人工智慧技術。
除收購外,蘋果最近還招聘了數名人工智慧大腕,其中包括英偉達的一名深度學習專家。當然了,並非蘋果所有人工智慧努力都是為了Siri,但是,鑑於iPhone佔到其營收的63%,蘋果肯定會努力使Siri比其他語音助手更聰明。
谷歌GoogleNow
谷歌已經在GoogleTranslate等應用中部署神經網路處理技術,這使得GoogleTranslate能把一種語言即時翻譯為另外一種語言,而無須上網獲取資訊。
GooglePhotos應用利用名為TensorFlow的深度學習系統,對應用中的照片進行分類,使使用者能更快速地發現要找的照片。
但谷歌並非僅僅對深度學習和神經網路技術感興趣,它還利用人工智慧系統預測使用者的需求。谷歌嚴重依賴通過其他應用、Gmail和搜尋服務收集的資訊,然後通過GoogleNow提供預測性資訊。
部落格網站SearchEngineLand最近刊文稱,“GoogleNow完全基於雲端計算技術。谷歌通過任何裝置和服務收集的資訊,都會統一儲存在雲端計算環境中。”
谷歌利用基於雲端計算的資訊為GoogleNow提供支撐。隨著谷歌更多地涉足基於雲端計算的神經網路,GoogleNow的預測能力會進一步提高。
微軟Cortana
微軟已經將神經網路技術用於Skype應用,有助於翻譯使用者實時對話中的不同語言。微軟語音助手Cortana也利用神經網路技術完成語音識別功能。
但微軟在繼續擴大人工智慧技術的應用範圍。今年早些時候,微軟研究院披露,其深度學習系統在識別影像方面的表現好於人類。微軟深度學習系統的失誤率為4.94%,人為5.1%。
蘋果、谷歌和微軟希望利用神經網路和深度學習技術,推斷使用者在移動裝置上需要哪些資訊。
Cortana利用基於雲端計算的資訊幫助它理解使用者的問題,從必應搜尋引擎、電子郵件和Web瀏覽歷史中收集資訊,幫助它理解使用者的需求。隨著微軟研究院的更多研究成果被用於Cortana,微軟將能夠提高語音助手預測使用者需求的能力。
尚未分出勝負
目前還很難估計哪個平臺在擴大神經網路應用方面做得更好。語音助手給人的感覺是一項“有則更好”的特性,在幫助使用者完成日常任務方面並非是必須的。如果這些科技公司繼續研發神經網路、深度學習等人工智慧技術,語音助手可能成為未來裝置中最重要的部分之一。