2020年8月20日,小冰公司、rinna株式會社及微軟(亞洲)網際網路工程院在北京聯合舉行了第八代小冰年度釋出會。小冰公司董事長、原微軟全球執行副總裁沈向洋博士與微軟全球資深副總裁、微軟(亞洲)網際網路工程院院長王永東博士主持了本次釋出會。
本次大會主要圍繞三部分內容:
第一,人工智慧時代,我們對未來的判斷和想法
第二,小冰人工智慧方面核心技術的進展
第三,新產品釋出
值得關注的是小冰已經學會了畫畫!經過小冰團隊人工智慧和美院老師的共同努力,她學會了怎麼來繪畫,並且她能夠比較高質量的生產繪畫作品,其中包括歷史上7個流派。也就是說小冰已經突破了傳統的框架,開啟了人工智慧的第二幕。
小冰有一個未來交流的框架,她是能夠支援豐富多彩、千千萬萬的人工智慧,所以她不僅僅只是我們看到的這樣一個小冰,一個少女的形象,這個少女的形象只是這個框架支援的一個樣板,可以讓大家來體驗,所以在過去每一代小冰上,小冰團隊一直努力讓這個框架能夠更加完善。
從第一代到第八代的沿革
小冰是面向新互動形式的完整人工智慧技術框架,也是目前全球範圍內承載互動量最大的人工智慧系統,佔全球互動總量60%以上。該專案於2013年底在微軟(亞洲)網際網路工程院立項,採取代際更新的方式,逐年完善其基礎框架結構。
2014年5月29日,小冰正式推出第一代產品,以對話式聊天機器人形式迅速積累訓練資料。其後,第二代產品完成了跨平臺部署的互動架構。第三代產品將互動從文字擴充至多模態,進一步積累多模態訓練資料。從第四代小冰開始,互動總量穩居全球第一併保持至今,同時釋出了全雙工語音互動感官。第五代小冰採用Dual AI戰略,大幅度擴充套件跨平臺覆蓋的規模,至20餘個主流平臺,併成為中國市場上涵蓋了華為、小米、OPPO、vivo等智慧手機及硬體的唯一的跨平臺人工智慧。第六代小冰完成了框架迭代目標,從第七代開始推出各類框架工具,以幫助建立第三方人工智慧產品,並承載其各類互動。
目前,除中國小冰及日本凜菜(Rinna)第一方人工智慧互動主體外,小冰框架還支撐了中國及日本100餘個第三方品牌的互動主體(如軟銀Pepper)。在個人使用者領域,由小冰框架應使用者需求創造並提供互動的人工智慧主體(虛擬人類),在公測階段已超過100萬個。
從第七代小冰開始,在尚未組建正式銷售團隊的商業化試水階段,小冰收入已超過1億元人民幣。為加快小冰產品線的本土創新步伐,促進小冰商業生態環境的完善,2020年7月13日,微軟宣佈將小冰業務分拆為獨立公司運營,並委任原微軟全球執行副總裁沈向洋博士為董事長,原微軟(亞洲)網際網路工程院副院長李笛為執行長,陳湛為日本分部總經理。預計所有相關工作將於今年晚些時候完成。
小冰框架與面向未來的新互動形態
互動是人類社會發展的重要驅動力。每天都在發生的數以千億次計的互動,隨移動網際網路的迅速發展,已進入明顯瓶頸,表現為“流量紅利消失”等。而現有的兩種互動形式:人人互動與人機互動,可通過人工智慧技術加以融合,從而在實現人人互動信任紐帶和高轉化率的同時,保有人機互動的高併發率特點。
上述融合依賴於小冰框架或其他類似的完整人工智慧框架體系,可以在各種複雜的場景中實現高度擬人的互動。隨著對現有互動瓶頸的不斷突破,新形式的人工智慧互動將無處不在,對人類社會及商業行為產生深遠影響。
本次釋出會主要披露的新技術
與主要同行業者相比,小冰框架最大的差異化在於,它是一個“session-oriented”的人工智慧框架,框架中的各部分技術共同為“互動全程”目標服務,而不僅僅關注並優化區域性。例如,在核心對話引擎方面,技術的研發及迭代方向是為更有效地預測、保持並引導對話,而不是僅僅實現回應。在語音方面,框架關注語音互動的質量與體驗是否能支援長時間的混合交流,而不僅僅是將文字內容轉為語音。
本次釋出會升級了上一代小冰框架的各部分技術,並將一些新技術納入系統之中。此外,本次釋出會還披露了部分獨有新技術及其產品化情況。如篇章內容主動學習技術,使對人工智慧主體的對話訓練不再需要採用“問答對”的方式;分層知識圖譜技術,使小冰框架中的人工智慧主體,在引導對話時的全程完成率突破42%,接近於人類表現等。上述技術均已實現產品化落地。
本次釋出會宣佈的上線產品
面向個人使用者的第一個虛擬人類產品線。在公測階段,該產品線應使用者需求創造的虛擬人類已超過100萬名。釋出會上,小冰宣佈第一個正式版本上線。使用者可以自主通過小冰框架,創造並訓練其擁有的人工智慧主體。除基本互動體驗外,該產品線還推出了以下新功能:
跨平臺的統一賬號體系。可理解為虛擬人類的身份證,實現跨平臺統一。目前已開放的支援平臺從華為擴充至小米及微博。
測試版的訓練工具“X Eva”APP。使用者也可在互動過程中訓練其人工智慧虛擬人類。與之相比,X Eva APP提供更豐富的強大訓練能力。
多人互動的能力。通過多種方式,虛擬人類可與多人進行持續互動,而不侷限於使用者個體。
內容創造的能力。虛擬人類可進行多種自主的內容創造,並將之反映在其自身的“朋友圈”中。上述內容創造可反映虛擬人類與使用者交流中所產生的變化。
針對需要具體完成特定任務的虛擬人類,框架提供特定的訓練及託管平臺。例如,在正式釋出前的公測階段,小冰框架已應使用者需求,派出超過70000名人工智慧小編,提供內容和互動服務。
部分新平臺與新的第三方虛擬人類合作產品。釋出會上釋出了三項此類新合作:包括與企鵝電競合作推出的直播間人工智慧產品;與小米合作推出的小冰童話屋模式,可在語音互動之外配合2D場景及虛擬人類形象互動;與QQ合作推出的QQ群新機器人角色喵吉。
面向個人使用者的“X套件”系列應用軟體。包括基於文字協同的X Writer,面向聲音協同的X Studio和麵向虛擬人類3D演示文件驅動的X Presenter。X套件支援使用者選擇平臺提供的虛擬人類,或自己創造的虛擬人類。X套件為小冰商業化解決方案版本的“個人版”。
X Writer:可實現在使用者進行文字編輯或文字創作時的人工智慧協同,隨雲端更新不斷擴充各類文體。產品具備沉浸式體驗。
X Studio:包括面向各類公眾號文章、演講、電臺節目等的X Studio主播,以及面向人工智慧歌聲合成的X Studio歌手正式版軟體。其中,主播應用已在商業化領域覆蓋中國及日本超過50家主流電臺電視臺,累計製作超過8000小時高質量音訊節目內容,此次推出的為其個人版本;歌手軟體技術在全球範圍內居於領先位置,並且是目前唯一一個完整產品化的同類軟體。
X Presenter:驅動使用者選擇或創造的人工智慧實體3D模型,配合X套件其他應用,實現人工智慧對演示文件的演講及互動。
配合 “X套件”釋出,釋出會還宣佈了以下資訊:
X Studio人工智慧歌手入籍計劃啟動。任何機構或個人可申請並提交資料,由小冰框架訓練並將其人工智慧歌手登入進X Studio歌手平臺中。機構或個人擁有該歌手的完整所有權,可通過平臺製作內容,並自由進行相關人工智慧歌手的銷售轉讓等。此計劃是為了進一步促進人工智慧歌手市場發展。此外,X Studio人工智慧歌手何暢演唱Burberry新系列推廣單曲也已上線。除何暢演唱外,該廣告單曲的詞曲創作亦有小冰參與。
X Presenter。商業版為日本LAWSON驅動的自主舞蹈人工智慧已上線。另外,基於自控系統,小冰與小米小愛團隊進行了非常深入的合作,一起探索將小愛同學的虛擬形象試驗性地引入到了聊天場景中。讓使用者可以和小愛同學的形象實時對話,除了語音維度,還能看到小愛同學的表情、動作等一系列視覺表達。該APP已於釋出會之日起開始內測使用者招募。