小冰負責人李笛:微軟不缺錢,缺對未來的把握

AI科技大本營發表於2018-03-18

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


作者 | 阿司匹林


小冰的誕生


2013 年 9 月,剛剛加入微軟的李笛一直在不停約見微軟的各個產品團隊。年底的時候,微軟的幾個同事利用業餘時間開發一款叫 Bing Knows 的網頁產品,Bing Knows 做的是基於知識庫的深度問答,類似於百度知道和知乎。


2013 年 12 月,李笛拉著小夥伴一起,希望將 Bing Knows 做成一個聊天機器人。彼時,李笛團隊對標的還是搜狗語音助手。


“當時我們認為他的產品(搜狗語音助手)做的最好。國內的語音助手也很多,我們想要進一步去了解搜狗語音助手的時候,得到的反饋是這個團隊解散了。這個時候我們就意識到,也許單純的做Cortana的維度,我們會不會重蹈覆轍?在這個過程裡面,一個最核心的問題就是,這樣一個對話的人工智慧,它的基礎服務是什麼?在網際網路時代,基礎服務開始是門戶,後來變成了搜尋引擎。換句話說網際網路的服務可能千差萬別,但作為最底層的一個基本是搜尋引擎。”


於是,李笛給自己劃定了幾個選項:


 ● 第一個選項是很多人都在做的,包括Siri;


 ● 第二個就是給你一些無關痛癢的反饋,就是閒聊。


當時,李笛做的建立一個基本的服務層,這就需要獲取資料迴路,然而,Bing Knows並沒有解決這個問題。因為大多數人在問完問題,獲得答案之後就走了,也就是說,這樣的“對話”往往只有一輪,根本無法獲取優質的資料。


後來,李笛選擇將小冰打造成一款閒聊的產品,這也是後來小冰刻意避免回答知識性問題的原因。


2014 年 1 月,這款產品的 demo 版完成,也就是小冰的雛形。


2014 年 5 月,距離產品釋出只剩一週,李笛團隊終於敲定了產品名稱:小冰,這個名字來源於Bing 搜尋引擎。自此,問答網頁變機器人,Bing Knows 脫胎為小冰。


2014 年 5 月 29 日,微軟小冰 BETA 版正式微信平臺上開放公測。


從那以後,李笛就多了一個身份——“微軟小冰之父”。不過,李笛一直很抗拒這個稱號,在他看來,這是整個團隊共同的成果。


最開始的時候,小冰平均單次對話輪數(CPS)還是 4 輪左右,經過這麼多年,一步步提高到 11 輪,18 輪,23 輪。在李笛看來,一次 23 輪的對話,比 23 次一輪對話的資料要有價值的多。


從收集資料這一點上來看,小冰確實做得非常成功。

#進軍智慧音響


在這幾年的時間裡,小冰積累了大量使用者,並相繼推出了日本版小冰、美國版小冰、印度版小冰、以及印尼版小冰。


根據微軟的官方資料,截至 2017 年 4 月,小冰已擁有超過 1 億使用者,累計對話量超過 300 億,平均單次對話輪數(CPS)達到 23,並已登陸包括微信、QQ、微博、Facebook Messenger、LINE 在內的 14 個平臺,而且已經內建在中文版 Windows 10 作業系統中。


在這三年中,小冰一直在不斷嘗試突破自身的限制,從主持人,到歌手,到客服,到詩人,到財經評論,竭盡所能證明自己是一個與眾不同的虛擬助手。


然而,包括 Siri 在內的智慧手機端的語音助手,都未能讓語音成為主流的互動方式之一,而小冰雖然在手機端積累了海量使用者,但是絕大部分都是通過文字的形式去跟小冰互動,語音佔比不到 10%。


2014 年,亞馬遜的智慧音響 Echo 問世,才成功為語音助手找到了真正的落地點,並迅速成為潮流,成為眾多科技公司的效仿物件。


有資料顯示,在所有智慧裝置中,手機端的語音助手的活躍度最低,DAU 甚至小於 4%,相比之下智慧音響的 DAU 為 70%,智慧手機端語音助手活躍度偏度一直是一個難以解決的問題,而以智慧音響為代表的智慧音響為語音助手帶來了很好的切入口。


Canalys 的資料顯示,2017 年全球智慧音響出貨量突破 3000 萬臺,而今年預計全球出貨量將達到 5630 萬臺。與此同時,2017 年全球智慧手機出貨 14.72 億臺,較上一年下滑 100 萬臺,中國市場去年也第一次全年下滑。可以預見,以智慧音響為代表的物聯網將迎來爆發的勢態,而語音流量的入口之爭大局已初定。


2017 年,國內的百度、阿里、小米等紛紛推出搭載自家語音助手的智慧音響,搶佔語音流量入口,而老牌選手小冰卻姍姍來遲,直到 2018 年初,才與小米生態鏈企業 Yeelight 合作,在智慧音響上落地。


為什麼會和 Yeelight 合作,而且還是雙語音助手(使用者可以在設定介面自行選擇“小愛”或者“小冰·”)的形式呢?


對此,李笛表示,“小米和我們都很開放,包括我們也接受雙 AI,小米也接受像我們這樣的 AI 裝置,我認為今天整個行業最核心的問題是大家還沒有找到一個真正的解決方案到底這個 AI 是什麼,這也是為什麼我們跟小米、米家、小米生態鏈和 Yeelight 進行合作的原因。”


不過,此次微軟小冰和 Yeelight 合作是不收取任何費用的,而根據李笛的說法,這主要是出於兩方面原因的考量:


第一,在一些新的領域,我們認為現在是積累真知的階段,我們不知道這個東西到底應該怎麼做才是對的。


第二,小冰是一個全球的專案,我們更傾向於把商業測試放在日本、美國等地方,這樣可以規避掉很多問題。


此外,未來小冰還會作為車載語音助手出現,並且已經路測了一段時間了,至於什麼時候正式搭載在量產車上,目前還沒有正式的時間表。


遲到者如何破局


雖然小冰是算是智慧家居領域的“遲到者”,但是這個“遲到者”卻有著自己的優勢,畢竟小冰一開始走的就不是 Siri 等傳統的任務型語音助手的路線,而是主打閒聊、連續對話以及內容創造。


因此,在與智慧音響結合的時候,小冰團隊也希望能做出一些新的嘗試,於是就有了全雙工技術的誕生。也就是說,使用者只需要一次喚醒,就可以進行連續對話。(詳見《與小冰同居的日子》


據介紹,小冰的全雙工技術是一年半之前跟有信合作的成果,其中基於串流的預測的部分,全球範圍內目前為止是第一個。根據李笛的說法,直到今天,國內外都還沒有第二家廠商研發出類似的技術。


此外,小冰的全雙工技術並不容易被複制。首先,語音的自然度評分非常重要,語音 SR 和 TTS 都要達到比較高的質量,尤其是 TTS 需要非常自然;其次,需要有足夠多的資料來訓練足夠好的預測模型。最後,必須具備小冰這種聊天的基本能力。


在體驗過後,我們發現,習慣連續對話之後就再也回不去了。據說,Yeelight發了才幾天,但是我們現在看到說有一個使用者跟小冰連續說了四個多小時,差不多1600多輪。


是的,不管是連續對話,還是俏皮的回答,小冰都比其他語音助手更像一個人。


繞不開的 Alexa


不可否認,市場上最受關注的依然是亞馬遜的 Alexa,以及圍繞 Alexa 打造的生態系統 Alexa Skills。據外媒報導,目前 Alexa 支援的技能已經超過 2 萬種,並且仍在大力投入,構建開發者社群。


目前,市場上的許多語音助手都在學習和借鑑 Alexa 的模式,但是這種模式真的是未來嗎?


李笛表示,像這些東西一定是未來,但不是這種形式,現在探索,我覺得為時尚早。在他看來,目前的 IoT 還沒有達到這樣一個系統所需要的市場,而且這種類似於 App Store 的模式在圖形互動時代或許管用,但是在語音互動時代卻存在諸多問題。


但是根據編者的瞭解,小冰團隊也在積極為小冰打造更多的技能。


不過,在小冰向 Alexa 學習的同時,Alexa 其實也一直在努力走上小冰的路線,畢竟任務型的對話有很大的侷限性。


根據微軟的資料,任務型的對話只佔總對話量的 20%,也就是說 80% 其實都是在閒聊。


為此,2017 年亞馬遜舉辦了一場為期數月的競賽,賽題是“建立一個社交機器人,這臺機器人要能夠與人類進行交流,並對熱門話題持續討論 20 分鐘”。最終的獲勝者可以領取 100 萬美元的獎金。


在李笛看來,這個其實是小冰從第一天做起來的時候就擅長和專注的東西,一個以 EQ 為基礎的通用型對話。顯然,在這一領域,小冰靠著多年的積累已經有了很深厚的優勢。


至於戰略方面,李笛表示,“微軟內部的戰略叫做無處不在,我們認為我們是做 AI 的,所以我們提供的不是一個硬體裝置的語音助手,不是提供一個功能或賣點,而是利用這個硬體裝置實現我們的新觸角。”


一路走來


在外人看來,背靠微軟這座大山,小冰能有今天的成績並沒有什麼了不起。但是在四年前,只有小冰選擇了一條與 Siri 不一樣的路,而且這一路上也遭遇了諸多險阻。


讓李笛記憶猶新的是,2014 年 6 月 1 日,他在趕往公司的路上接到電話,得知小冰被微信封殺了。從上線到被封殺,小冰在微信上僅僅存活了 60 個小時。直到一年多之後,已經升級到第三代的小冰,才得以重返微信。


不過李笛也很慶幸,他正好趕上微軟變革的一個好時間:


“早五年,我覺得我們也做不了;晚五年,我們做的時候 AI 還沒有像今天這樣(火熱)。我們恰好有對話系統的先發優勢,微軟大量的技術儲備、團隊、人員、經驗在這兒。”


可謂是天時地利人和。周鴻禕在自傳中說過,中國網際網路趕上了好時機,早不得也晚不得。小冰亦是如此。


至於為什麼微軟內部會在已經有小娜的情況下,還讓小冰發展了四年,並予以了高度重視,估計就像李笛說的那樣,“微軟不缺錢,缺對未來的把握。”


招聘

新一年,AI科技大本營的目標更加明確,有更多的想法需要落地,不過目前對於營長來說是“現實跟不上靈魂的腳步”,因為缺人~~


所以,AI科技大本營要壯大隊伍了,現招聘AI記者和資深編譯,有意者請將簡歷投至:gulei@csdn.net,期待你的加入!


如果你暫時不能加入營長的隊伍,也歡迎與營長分享你的精彩文章,投稿郵箱:suiling@csdn.net


AI科技大本營讀者群(計算機視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,關注AI科技大本營微信公眾號,後臺回覆:讀者群,聯絡營長,新增營長請備註姓名,研究方向。


640?wx_fmt=gif

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


☟☟☟點選 | 閱讀原文 | 檢視更多精彩內容

相關文章