蘋果和Siri的七年之癢:Siri的落寞之路

AI科技大本營發表於2018-03-17

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1



編譯:AI科技大本營

參與:王珂凝 編輯部


【AI科技大本營導讀】曾經,我們一度認為 Siri 將會是蘋果的下一個重大創新。 但在 Siri 推出七年之後的今天,它卻成了蘋果的“拖油瓶”。本文講述了 Siri 的落寞之路。


2011 年,庫比蒂諾總部,蘋果公司舉辦了 “Let’s talk iPhone” 新品釋出會,那是一個歷史性時刻,是新任執行長蒂姆·庫克的第一次大型釋出會。他試圖通過這次釋出會來續寫史蒂夫·賈伯斯的產品故事。 但令人失望的是,當時釋出的不是一款全新的 iPhone 5,而是 iPhone 4 的更新版 iPhone 4s。


Siri 拯救了這場令人失望的釋出會。這款數字語音助理產品在釋出會上所展示的對語音指令的響應能力,讓評論者驚歎不已。它能夠通過指令自動建立提醒、預先設定日程活動或為使用者提供有關餐館或天氣的資訊。人們一致認為,它會是一種具有革命性意義的產品。這也間接助推了 iPhone 4s 的銷量,推出後短短三天內,蘋果就銷售了四百萬部手機,在當時,這是有史以來銷量最高的 iPhone。


如今,距離 Siri 釋出已經七年了,它飽受詬病。根據分析師的早期推斷,Siri 是影響蘋果最新產品效能的主要原因——一款售價 349 美元的 HomePod 智慧音響。儘管這款音響借其時髦設計和完美音質贏得了不少讚譽,但在測試之後,由於總是發出諸如“笨拙”、“煩人”和“尷尬”等詞,這讓蘋果最終放棄了音響的 Siri 語音功能。


為了弄清蘋果在語音助理領域是如何打敗亞馬遜和谷歌等競爭對手的,The Information採訪了十幾名蘋果的前員工,他們曾在不同的團隊中負責開發  Siri 或負責將其整合到蘋果系統中,絕大多數人匿名發表了他們的看法。


前員工發表他們的看法並不常見。蘋果正努力重塑自我形象,除了硬體設計,也試圖致力於創新和提供高質量線上服務。它曾在線上服務業務,尤其是低質量的 iCloud 服務上摔過跟頭。隨著 iPhone 銷售量的逐年走低,線上服務也許會對蘋果未來的發展造成傷害。


在 Siri 技術尚未完全成熟之前,蘋果就決定要將 Siri 嵌入 iPhone 4s 系統中,上述很多前員工表示,這在內部立刻引發了一場激辯:是否繼續修補有缺陷的架構?還是將其推倒重來?這場辯論自 Siri 釋出以來愈加熱鬧。這場辯論只是個開始,Siri 的各個團隊更熱衷於參與小團體鬥爭,並就 Siri 的理想版本發表激烈爭論——它到底是快速準確的資訊獲取者?還是善於處理複雜任務的資訊助理?


這些團隊的勾心鬥角在領導者和中層管理人員之間你來我往,他們缺乏賈伯斯的遠見和影響力。與此同時,噩耗傳來,賈伯斯在蘋果推出 Siri 後的第二天因患胰腺癌去世。這些前員工表示,領導力缺乏和人員不斷流動使 Siri 重新陷入了困境。但導致其失敗的最主要原因是蘋果不對外開放的封閉文化,它未能給外部開發人員提供更多機會開發更多有用的 Siri 應用。


一直以來,Bill Stasior 負責管理 Siri 的開發部門, 他是一名安靜而謙遜的工程師,曾是亞馬遜傑出的搜尋專家,隨後於 2012 年末加入蘋果。Stasior 負責 Siri 的核心技術——語音識別系統、自然語言處理系統以及蘋果的各種搜尋功能。 Siri 的前員工們表示,這些部門之間相互競爭是為了獲得更多關注和資源,並且部門之間也經常發生衝突。


蘋果發言人拒絕了讓 Stasior  接受媒體的採訪。在一份宣告中,他們宣稱 Siri 是“全球最受歡迎的語音助理”,並吹捧了它在蘋果裝置上的強大能力。


“Siri 在效能表現、可擴充套件性和可靠性等方面已經取得了重大進步,我們採用了最新的機器學習演算法使其具有更自然的聲音和更強的主動性,”蘋果在宣告中寫道。 “我們將繼續加大對機器學習和人工智慧領域的投資,不斷提高 Siri 所提供答案的質量,也會不斷擴大 Siri 回答問題的範圍。”


可以肯定的是,沒有哪家公司能夠擁有像科幻電影裡那樣完美的數字語音助理,而蘋果的產品在某些領域確實領先於亞馬遜和谷歌:Siri 支援 21 種語言,而亞馬遜的 Alexa 只支援 3 種語言;Google Assistant 則支援 8 種語言(谷歌上個月表示,Google Assistant 不久就會支援超過 30 種語言)。Siri 每個月在超過 5 億臺裝置上使用,每週則需要處理 20 億次問答請求。


和首次推出的 Siri 相比,現在 Siri 對指令的響應速度要快很多。而在使用者數量方面,由於 Siri 嵌入在了號稱蘋果最暢銷產品之一 iPhone 中,他們自信宣稱,使用 Siri 的使用者要遠遠超過其他語音助理。


儘管如此,與其競爭對手相比,Siri 的能力仍然有限。2016 年,蘋果推出了 SiriKit,這是一款能夠讓外部開發人員有機會為 Siri 開發新功能的工具,但可惜沒有極大吸引開發者的興趣。


與之相比,它的競爭對手亞馬遜 Alexa 則擁有 25000 個由第三方開發人員構建的“技能(skills)”。Google Assistant 則擁有 100 多萬種“行為(actions)”,其中包括谷歌寫入的命令(如通過谷歌地圖進行導航)以及由第三方開發的功能(谷歌沒有透露第三方開發的數量)。這些競爭平臺在使用量上也在迅速趕上蘋果:谷歌 1 月份宣稱 Assistant 已使用在 4 億臺裝置上,而亞馬遜也表示僅在節假日期間,就已經賣掉了“數千萬”臺基於 Alexa 的裝置。


“當Alexa 出貨時,銷量從第一天開始就非常穩定,”一位前 Siri 團隊成員說。 “對於 Siri 來說,想要達到這一點,他們幾乎要推到重來。”


宇宙中的足跡


Siri 公司成立於 2007 年,由史丹佛研究院——一個位於門洛帕克的非盈利研究組織——負責這項技術的研究 。 Siri 最初的構想是成為一個智慧數字語音助理:能對使用者請求作出響應並和使用者進行互動以獲取所需要的回答。例如, 理想情況下,Siri 並不會直接給出一個餐廳的電話號碼,而是通過溝通與使用者確認清楚細節,如日期、時間和參加派對的人數,然後直接自行預訂餐廳。


Siri 的設計者們認為,解決這一問題的唯一途徑就是建立一個開放平臺,允許外部開發人員參與 Siri 的開發,這樣才能使 Siri 的功能數量遠遠多於“閉門造車”。


“這是一個關於為人工智慧開發應用程式的問題,” Siri 的一位高管說, “它應該成為一種通過對話來協調網際網路的一種方法。”


Siri 公司創始人兼董事會成員 Norman Winarsky ,認為賈伯斯是 Siri 潛力的忠實信徒。2010 年的某一天,賈伯斯邀請 Siri 執行長 Dag Kittlaus 及該公司的三位聯合創始人到他的家中會面。數小時以後,賈伯斯最終說服該團隊,摒棄其他合作者,全身心投入蘋果公司,並讓他們相信,他們將會在 Siri 上實現更大的目標。


“賈伯斯極大地鼓舞了這個團隊,” Winarsky 談到 Siri 聯合創始人。 “他讓這個團隊所有人都相信,他們可以在宇宙中留下自己的足跡。“


2010 年 4 月,蘋果以超過 2 億美元的價格收購了 Siri 。當時, Siri 只有24名員工,但蘋果很快擴充了 Siri 的核心團隊人才。18個月後,Siri  和 iPhone 4s 一起推出,Siri 的團隊已經發展到近100人。


在收購之後,賈伯斯仍然對 Siri 保持密切的關注。該團隊的前員工表示,賈伯斯每週都會出席一次會議,並就 Siri 即將釋出的功能發表自己的意見。當時擔任蘋果高階副總裁的 Scott Forstall,也很支援 Siri 團隊。Forstall 對該產品能夠做什麼具有很強的洞察力,並且喜歡親力親為。一位前僱員表示,他每天都會研究技術,經常在參加團隊會議的時候告訴大家:“昨晚我又發現了10件事”。


為確保 Siri 按時釋出,該團隊在 Siri 的最初構想上做了一些妥協,“人工智慧應用商店”計劃不得不擱置。賈伯斯希望, Siri 專注於一些只有蘋果公司才能完全控制的技術,但早期的 Siri 成員表示,賈伯斯承諾會在晚些時候開始構建第三方生態系統。


2011年10月4日,Siri 釋出的第二天,賈伯斯因癌症的長期困擾而去世。Siri 成員表示,賈伯斯的去世,基本上標誌著 Siri 初始計劃破滅。


“當 Siri 釋出的第二天,賈伯斯去世的時候,Siri的初始計劃就泡湯了,”前僱員回憶道, “他們因此也失去了巨集觀上的大方向”。


混亂的開始


在這以後, Siri 團隊仍然有 Forstall 的支援,但 Forstall 的注意力同時也分散在其他主要專案中,包括即將推出的蘋果地圖( Apple Maps)。 Forstall  任命蘋果地圖團隊中的副手 Richard Williamson 領導 Siri 團隊,試圖讓一切重回正軌。


幾名前員工表示,Williamson 做出的很多決策都遭到其他成員的反對,其中包括對 Siri 每年只做一次升級。這是蘋果在 iOS 系統升級上的常用策略,而 Williamson 以前的工作就是讓軟體從後端伺服器的更新執行在手機上。 Siri 成員表示,這種模式是錯誤的, Siri 應該是一個不斷改進的線上服務,而不是每年只更新一次。雖然伺服器軟體在穩定性和效能方面做了很多更新,但在第一年裡, Siri 架構並沒有做任何改變。


Williamson 在一封應邀採訪的電子郵件中寫到,他認為 Siri 不持續更新這件事是“完全不符合實際”的,有關“軟體和伺服器基礎設施技術方面”的決策由他的下屬員工來決定,而他只負責讓團隊重回正軌。


“ Siri 釋出成了一場災難,” Williamson  寫道, “它執行速度很慢,並且有很多嚴重的錯誤,這完全取決於 Siri 以前的團隊,而不是我的問題。“


在宣告發表後,Kittlaus 回應到:“這個宣告簡直是滿口胡言,是蘋果歷史上最大的災難!而這一切都是蘋果地圖的負責人 Williamson 所導致的。事實上,Siri 在釋出時的表現的非常出色,但是和任何一個新平臺一樣,在意外大規模負載的情況下,都需要進行負載規模的調整和24小時不間斷的維護。”


Siri 首次釋出時,使用者數量的激增超出預期,軟體開始崩潰。工程師忙於維持後臺的正常執行,但基礎架構根本無法應對大量的資料流入。一名被任命到基礎架構的員工回憶道,最初需要 500 臺伺服器處理 Siri 任務,在改進之後,才縮小到 5 臺伺服器上。


“在當時,這就像一場戰爭,”另一名前員工回憶道。


上個世紀 90 年代,曾與 Siri 聯合創始人 Adam Cheyer 在 SRI 一起工作的 Luc Julia 被任命為 Siri 團隊的主管。幾位 Siri 前員工很喜歡在 Julia 領導下工作, 但是 Williamson 寫道,Julia 與蘋果公司的一些人發生衝突,其中也包括 Forstall 。而當 Forstall 施壓促使 Julia 離開 Siri 時,Williamson 照辦了。在管理 Siri 團隊不到一年後,Julia 離職了。


Williamson 在郵件中寫道,他試圖讓團隊實施 SiriKit 專案,允許外部開發人員對 Siri 的功能進行改進,但遭到 Siri 團隊的抵制,因為 Siri 的“初始軟體非常脆弱、死板”。


Williamson 和 Siri 團隊之間的分歧,致使聯合創始人 Cheyer 於 2012 年 6 月離職,他也是 Siri 團隊最忠實的支持者之一。在另一位聯合創始人 Kittlaus  離職一年後, Cheyer 很快也離職了,這又導致了 Siri 團隊的其他幾名創始成員離開了該專案。


也在當年年底,蘋果地圖 iOS 6 系統中發生災難性的錯誤時,蘋果解僱了Forstall 和Williamson。Siri 前員工說,失去了這位始終支援他們工作的 Forstall ,他們感到很遺憾。


轉向搜尋


在蘋果收購 Siri 不久,賈伯斯發表了他的獨特見解。


2010年6月,賈伯斯在《華爾街日報》的 All Things Digital 技術大會上表示:“ Siri 無意涉足搜尋領域,他們屬於人工智慧領域......我們並沒有進軍搜尋領域的計劃,這並不是我們感興趣的領域,其他人在這個領域做得更好。“


但是,高質量的搜尋裝置仍然是數字語音助理的關鍵。當使用者提出問題時,人工智慧需要接入知識庫並快速做出正確響應。


賈伯斯的這一觀點表達了 Siri 團隊中許多創始成員的想法: Siri 將比搜尋更強大。一位 Siri 成員表示,他們對 Siri 最理想的設定與 2013 年 Spike Jonze 電影中的“她”類似,電影中 Joaquin Phoenix 飾演一個孤獨的男人,愛上了他所熟悉的作業系統 “Samantha”。


持有同樣觀點的員工表示,像 Stasior 這樣的搜尋專家被任命領導 Siri 時,他們立刻表示懷疑。 Stasior 擁有博士學位,並獲得麻省理工學院電腦科學學位,自 2006 年至 2012 年擔任亞馬遜的總裁兼執行長,並協助建立了亞馬遜搜尋部門—— A9.com。


Siri 團隊成員認為 Stasior 沒有語音或自然語言處理方面的背景,並不能成功的領導這個團隊。


“我意識到,儘管他對 Siri 特別感興趣,但他的最終目標還是要建立一個搜尋引擎,” Stasior 底下的一個僱員說道, “ Siri 僅僅是一個跳板。”


當 Stasior 初入蘋果公司時,其搜尋引擎功能分散在整個公司的各個應用中,並且有大量重複點。當時的在職人員說, Stasior 的主要工作就是將 Siri 和蘋果現有的搜尋功能整合,來改善 Siri 的核心效能,他還努力加強蘋果公司在搜尋技術領域的影響力,包括網路搜尋、媒體搜尋和維基百科的資料分類。


搜尋團隊員工表示,“ Stasior 的工作就是將搜尋作為一項核心資產,並使其成為蘋果公司的頂級產品,” 。


Stasior 努力促成了蘋果公司一系列的收購,以支援蘋果公司內部的搜尋人才和技術的發展。根據 TechCrunch 的報告,2013 年 10 月,該團隊以超過 4000 萬美元的價格收購了 Cue ,該公司建立了一個個人助理應用程式,通過使用者的電子郵件即可制定個人日程表。


2013年, Stasior 以超過2億美元的價格收購了 Topsy 。Topsy 技術被用在 Spotlight 中,它是MacOS 和 iOS 作業系統內建的 Apple 搜尋功能,並於2004年首次推出。


“ Bill 一旦發現了一些好東西,他就一定會去掌控,”一位負責收購調查工作的蘋果員工說, “他的目標就是儘可能多的獲得和鞏固更多優秀的搜尋人才。”


一位前員工表示,Topsy 團隊最終成長為 Stasior 手下一個龐大的組織,其員工數量現在幾乎可以和 Siri 團隊不相上下。 Topsy 的執行長 Vipul Ved Prakash 將繼續領導該搜尋團隊,並直接向 Stasior 做彙報。


將現有的 Siri 團隊與 Stasior 的搜尋團隊組合在一起,結果證明這是錯誤的決策。 Topsy 團隊並不願意和 Siri 團隊合作,他們認為 Siri 團隊研究進展緩慢,雖然最初的基礎設施已經修補完畢,但自發布以來並沒有完全更換。


“我有一種想法就是:為什麼我們不重新開始建立我們需要建立的東西?然後再擔心二者之間的協調?”搜尋小組的前成員提到, “但他們仍然著眼於二者之間的協調工作。”


這位前員工說, Siri 和 Spotlight 的核心技術是由 Topsy 技術和 Siri 資料服務二者組合而成,該服務基於 iTunes 舊的搜尋技術,針對 Siri 做了改進,並於 2013 年推出。 Siri 的資料服務處理諸如維基百科、股票和電影放映時間等事項,而 Topsy 則對 Twitter 、新聞和網路搜尋結果進行排序。 Prakash 計劃將所有的技術整合到一個堆疊中,最終將 Siri 資料服務團隊納入 Topsy 團隊中。 但是由於二者基於不同的程式語言,因此很難去協調。


整合搜尋團隊的困難導致了一些令人尷尬的後果:使用者使用 Siri 或 Spotlight 會得到了兩種完全不同的答案,而這些答案則是由兩種不同的搜尋技術支援而分別構建的。


地盤爭奪戰



Siri 的初始技術是利用自然語言處理來理解使用者的意圖。語音處理是一款可以檢測使用者語言的軟體,最開始,蘋果將該技術外包給了波士頓的 Nuance。後來在 Stasior 的領導下,蘋果開始專注於建立自己的語音識別軟體。


2013年,蘋果還聘請了經驗豐富的微軟語音識別專家 Alex Acero ,領導一個新的語音識別團隊。同年,蘋果還收購了語音創業公司——諾瓦瑞斯技術公司,用來積累語音技術方面的專業知識。蘋果公司計劃將新的語音識別技術與 Acero 的 Siri 核心技術相結合,希望以此來改善 Siri 的會話效能。 Siri 團隊認為,這種技術上的結合很重要,並很可能極大的促進 Siri 的發展。


在合作了6個月以後,這個團隊於2014年年底解散了。 Acero 繼續領導語音識別團隊,而自然語言團隊則由 Anoop Sinha 領導(曾在全球諮詢公司麥肯錫公司工作的管理顧問)。


接受The Information採訪的前員工表示,在這之前,高層從未對此解散做出任何解釋,倘若真的發生了這種事, Sinha 也會有他自己的管理方式。


由於 Sinha 沒有自然語言處理領域的專業背景, Siri 團隊的幾名成員都對他很反感。 他們認為,Sinha 的決策似乎源於辦公室政治,而不是科學研究。


一位前員工回憶了其中一次會議,當時Sinha 和 Acero 公開對峙,雙方層在專案分配上爭執不休,壓迫 Stasior 做出最後的決策。這兩個派別間的緊張局勢促使了另一批員工的離職,其中包括經驗豐富的語音科學家 Gokhan Tur 、 Chuck Wooters 、 Tom Kolla r和 Larry Gillick。


LinkedIn 上 Sinha 的個人資料顯示,他已於2016年從蘋果離職,現任 Facebook 的工程經理,並且沒有對評論做出任何回應。


許多離職多年的 Siri 員工與 Kittlaus 和 Cheyer 聯手,組建了一家新公司——Viv Labs,並繼續致力於構建更好的數字語音助理。 Stasior 對此感到很憤怒,“他們值得相信嗎?”一位前員工回憶道。


在得知 Kittlaus 和 Cheyer 繼續來觀看蘋果與他們的前 Siri 團隊的籃球賽之後,Stasior 就開始擔心他們會挖人。據當時在場的 Siri 員工回憶,不久之後,這兩人便被禁止進入蘋果的園區。


強大對手的崛起


為了讓 Siri 更強大, Stasior 又繼續進行了大手筆的收購。 2015 年 10 月,他主導收購了 VocalIQ——一家致力於研究動態學習系統的英國人工智慧初創公司。


一名 VocalIQ 團隊的前僱員談到,他們認為 Siri 其實是一個“手動作業系統”,並相信 VocalIQ 技術對於 Siri 的發展很有幫助。 VocalIQ 的技術可以從語音互動中提取重要資訊並對其進行分析,不斷的調整系統的準確性。 據相關人士透露,蘋果已成功的將 VocalIQ 技術整合到 Siri 日曆功能中。


此外,在前僱員 Rushin Shah 的領導下,更多的自動化機器學習技術被整合到了 Siri 的域選擇中 , 例如判斷請求需要傳送還是共享 。LinkedIn 上 Rushin Shah 的個人資料顯示,Shah 已於 2017 年從蘋果公司離職,目前在 Facebook 自然語言理解團隊中但任高階經理。


與此同時,蘋果將其在語音助手領域積攢了三年的優勢拱手讓給了亞馬遜和谷歌。 2017 年 6 月,《華爾街日報》在一篇報導里寫道, HomePod “在家庭音響市場上充其量也只能位居第三名”。


兩位 Siri 團隊員工告訴 The Information,為了應對這場競爭,直到 2015 年, 或者說是 2014 年底亞馬遜的 Echo 橫空出世時, Siri 團隊才知道蘋果的 HomePod 專案。據知情人士透露,蘋果公司原計劃就是要推出一款普通音響,並不會搭載 Siri。


蘋果突然決定將 Siri 納入音訊專案,使得 Siri 語音識別團隊不得不疲於應對與 Beats 公司的每週例會。早在前年,蘋果公司就以 30 億美元收購了 Beats。Siri 前員工 Chuck Wooters 提到,在早期的會議中,大約有 25 人蔘與,其中也包括通過通過視訊與會的幾名 Beats 員工。


Beats 團隊致力於研究麥克風降噪和波束形成演算法,以便更好地接收使用者的語音命令。在灣區周圍的公寓裡,蘋果公司安裝了麥克風用來收集資料,並模擬家庭環境,他們將這些資料稱為“室內脈衝響應”。


然而,Siri 的失敗之處在於,它仍然沒有構建第三方開發生態系統,而這恰恰是 Siri 最初構想的關鍵要素。曾參與過多個開發者工具包專案的前員工稱,該專案擱置多年以後,蘋果終於在 2016 年推出了 SiriKit 。然而據多名相關人士訊息,從 2012 年以來,蘋果就一直致力於構建開發工具包。


蘋果最終任命 Siri 團隊初創隊員 Vineet Khosla 負責管理 SiriKit 專案,通過外來開發者將他們開發的應用程式與 Siri 連線起來。蘋果這樣做的意圖似乎是為了提升 Siri 的功能,使其不再依賴於一些有限的本地應用,比如打電話或者發資訊。


但 SiriKit 尚未兌現其承諾。到目前為止,只有 10 項功能與其相關,例如付款、預訂遊樂設施、設定待辦事項和檢視照片等。一些 SiriKit 的高階工程師要麼已經離職,要麼已經離開這個專案。據知情人士透露,雖然 Khosla 仍然任職於蘋果,但已經不再領導 SiriKit 團隊,該團隊目前由 Siri 現任負責人 Robby Walker 領導。


一些 Siri 團隊的前員工指出,雖然蘋果曾經嘗試轉型成一家服務型公司,但其核心仍然是產品設計。在公司內部,建立完美的線上服務這一理念,遠不及設計具有變革性產品的意願強烈,而這也可能會像 Stasior 管理的專案那樣出現很多棘手的問題。


一前僱員表示:“蘋果公司的內部結構與員工的努力背道而馳,Bill 所要竭盡全力解決的一點就是和這種思想抗爭。”


640?wx_fmt=png


作者: Aaron Tilley,Kevin McLaughlin

原文連結:https://www.theinformation.com/articles/the-seven-year-itch-how-apples-marriage-to-siri-turned-sour


招聘

新一年,AI科技大本營的目標更加明確,有更多的想法需要落地,不過目前對於營長來說是“現實跟不上靈魂的腳步”,因為缺人~~


所以,AI科技大本營要壯大隊伍了,現招聘AI記者和資深編譯,有意者請將簡歷投至:gulei@csdn.net,期待你的加入!


如果你暫時不能加入營長的隊伍,也歡迎與營長分享你的精彩文章,投稿郵箱:suiling@csdn.net


AI科技大本營讀者群(計算機視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,關注AI科技大本營微信公眾號,後臺回覆:讀者群,聯絡營長,新增營長請備註姓名,研究方向。


640?wx_fmt=gif

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


☟☟☟點選 | 閱讀原文 | 檢視更多精彩內容

相關文章