亞馬遜對Alexa的投入可謂巨大,從200億到430億美元不等,且有約10,000人參與其中。然而,儘管如此,Alexa似乎已經落後於市場上的新競爭者,比如由小型3B LLM驅動的Siri。
組織問題:Alexa的阿喀琉斯之踵
(幾周前,OpenAI釋出了GPT-4 o,為具有複雜推理能力的多模式會話體驗引入了新標準。)
2019年,我作為研究科學家加入Alexa AI,那時Alexa已經在全球超過1億家庭中使用。當時,Alexa正處於高速增長期,每個季度都有新團隊加入,高層領導也明確表示,Alexa將是公司未來的重要投資。
我的團隊,後來被稱為對話建模團隊,從2人增長到20人,我們致力於將最新的人工智慧研究成果應用於Alexa產品和生態系統。我們構建了組織內的第一個大型語言模型(LLM),開發了基於知識的響應生成器,併為Alexa成為家中的多模式代理進行了原型設計。
技術與官僚的雙重挑戰
- 不良工藝:Alexa在保護客戶資料方面做得非常出色,但這也導致了開發人員在內部基礎設施上的不便。獲取資料進行分析或實驗需要數週時間,資料註釋質量差,檔案要麼缺失要麼過時。實驗常常在資源有限的環境中進行,這在硬體資源充足的亞馬遜看來是難以接受的。
- 碎片化結構:Alexa的組織結構是分散的,這導致了多個小團隊在不同地理位置處理有時相同的問題。這種分散的組織結構導致了團隊之間的競爭,而不是合作,進而影響了整體的效率和協同。
- 產品與科學錯位:Alexa以客戶為中心,這在內部意味著每一項工程和科學工作都必須與下游產品保持一致。這種壓力使得團隊難以進行長期的、實驗性的投資,而必須不斷地向高階領導層證明其價值。
未來展望
儘管Alexa已經銷售了超過5億臺裝置,擁有龐大的使用者資料,但這並不足以確保其在對話式人工智慧市場的領先地位。為了在未來的市場中取得成功,需要投資於強大的開發人員基礎設施,特別是在訪問計算、資料質量保證和簡化的資料收集流程方面。此外,需要確保產品時間表不會決定科學研究的時間框架,避免公司的教條和激勵結構扼殺所需的創造力。