虛擬人“覺醒”年,見證一場萬物的進化

naojiti發表於2021-10-28

麥克尼爾的《世界史》被公認是全球通史開山之作,他是這樣形容人類文明起源的:當文化演化超過生物演化而佔據首要地位時,嚴格而恰當意義上的人類歷史便發端了。

之所以聯想到這一典故,是因為近年來虛擬人發展得如火如荼,已經不侷限於如何在技術手段上更像人(生物演化),也開始呈現出文化上的生機勃勃,廣告代言、舉辦脫口秀、時尚博主、客服主播等等諸多新身份,也造就了虛實融合的“新文化”。

近日OPPO 開發者大會上更賦予了虛擬人一個新的能力,成為業內首個具備虛擬數字技術互動體驗的手機智慧助手。此外,OPPO 以小布助手為入口,開放了小布生態,未來開發者可以在平臺上定製專屬的小布虛擬人,搭載在多個智慧終端裝置上。

從個體進化到群體創生,從技術概念到商業生態,從這個角度來看,虛擬人這一“新物種”的文明歷史,在2021年已經正式開啟了。

那麼,當虛擬人“覺醒”,會給我們的生活帶來哪些改變?萬物互融時代,虛擬的與現實,數字世界與物理世界的邊界依然清晰嗎?對於開發者來說,為什麼虛擬人會是至關重要的一種能力、一個機會?

虛擬人覺醒年

說今年是虛擬人技術的“覺醒年”,並不為過。資本層面,許多虛擬人相關技術公司、AI公司都收穫了不少來自頭部網際網路企業的投資。消費者層面,今年科技企業也集體亮劍,將更多虛擬人形象推送到大眾面前。大致可以分為三個流派:

一、偶像派。2020年,由虛擬人技術創作完成的馬丁·路德·金登上了《時代週刊》,新一波虛擬人如口紅代言人的LING翎、時尚博主AYAYI等等,展現出了“帶貨”能力。技術上使用圖形渲染、動作捕捉、語音合成等,嘗試打造出逼真的擬人形象。這類虛擬人,往往需要過硬的作品和內容來延續商業價值,比如初音未來、洛天依等虛擬偶像,都有製作音樂專輯、舉辦演唱會等等,而不侷限於一張完美寫實的模擬臉及人設。

二、學術派。虛擬人要實現自然流暢的互動,模仿人類的表情動作,對技術實力要求很高,這也吸引了許多學術機構參與進來,比如清華大學計算機系知識工程實驗室的虛擬學生華智冰,浙江傳媒學院和廈門大學相關團隊聯合打造的虛擬人“西小施sisi”等,沒有明確的商業化場景,主要是向大眾展現虛擬人技術的最新能力。如果達不到大眾預期,或者出現“換臉”之類的負面新聞,就會給虛擬人IP蒙上陰影。

三、實用派。偶像派需要作品,學術派考驗技術,但企業還是需要與使用者進行有溫度、有情感的互動怎麼辦呢?於是實用派虛擬人紛紛登場了。它們大多是由企業機構與科技公司合作推出的標準化方案,代替真人進行內容生產和簡單互動,比如虛擬主持人、數字航天員、虛擬導遊等等。這類虛擬人並不需要高度擬真,技術難度相對較低,但也因為定製週期和成本較高,無法快速大規模推廣。

聽上去,似乎虛擬人只能作為一種被觀賞的景觀,停留在數字世界裡。這就夠了嗎?

虛擬人走紅的本質原因,是現實世界與數字世界之間,需要一種更具視覺化、沉浸式和情感溫度的互動方式。因此,作為兩個世界溝通的橋樑,虛擬人還有很多想象空間。

舉個例子,隨著智慧技術的發展,手機不僅是各種數字應用服務的中心,與其他IoT裝置的聯動也成為常態。萬物智聯更需要以人為中心,圍繞生活場景和行為習慣,實現智慧裝置間的無縫協作,讓使用者更便捷地獲取想要的服務。

以往這種從硬體到軟體,從技術能力到服務應用的服務體驗,主要是依託智慧語音助手來完成的。但是,語音互動更多的是簡單機械化的指令,能夠表達情感的地方很有限,難以撬動使用者心中溫柔的情緒,與智慧助手形成情感上的連線。更豐富的互動方式,是人機互動的演進方向,而具備語音、語言、3D視覺效果的虛擬人,自然也就成為語音助手的進化體。

可以預見的是,接下來虛擬人將在技術、場景、產業的澆灌下,展現出更大的生機與可能性,成為人機互動的全新方式。

基於以人為本的使用者洞察,OPPO思考很多,動作也很大。就在今年9月,OPPO率先推出了 “小布虛擬人”又在前不久的ODC開發者大會上,將小布升級為業界首個基於虛擬人多模態互動的手機智慧助手。

一場“新人類”的進化

進化的過程並不是一蹴而就的,需要在幾個關鍵節點上都發生正確的“突變”,才能演變出一個全新的物種。

想要讓虛擬人進化成為萬物智聯、人機無縫互動的核心,究竟分幾步?今天就以OPPO小布虛擬人為線索,看看虛擬人的“初長成”需要解開幾重結界。

第一重結界,多模態融合的互動能力。

我們可以將小布助手,看作是“虛擬人”的胚胎。作為搭載在OPPO智慧手機和IoT裝置上的智慧助手,今年2月,小布助手成為國內首個月活使用者破億的手機語音助手,而成為人機互動入口,毫無疑問,小布是一顆極具生長潛力的“種子”。

如何讓這顆“胚胎”,生長出自然逼真的感知系統、感官形象、思維大腦,成了“小布虛擬人”生命的起點,依賴於語音、視覺、自然語言處理等多模態融合演算法。為此,OPPO多年佈局的全棧式AI技術,就成為這一生命體的溫床。

首先,架設了AI整體技術架構,包括混合雲基礎設施、雲原生資料湖、端雲一體機器學習系統,以及語音、NLP、知識圖譜、CV、推薦搜尋等AI能力層,跨終端、多場景落地的業務應用層,為企業提供安全可信的AI安全能力層……這一基礎架構能夠為虛擬人所需要的AI能力提供基本的算力、演算法、安全等全方位保障。

其次,針對性打造虛擬人相關能力。作為有溫度的人機對話溝通載體,虛擬人需要在語言、表情、動作等方面都自然流暢,這就要求NLP、機器視覺、TTS語音合成等等多種基礎AI能力都達到國際頂級水平,才能讓使用者不感到違和。為了讓小布虛擬人達到較高的呈現效果,OPPO技術團隊今年上線了基於知識圖譜的NLP預訓練大模型,透過自建知識圖譜與對話上下文等資訊嵌入,結合公共以及小布積累的大資料集,融合後進行大模型預訓練,精準判斷使用者語言中的意圖。透過UniLM統一預訓練語言模型,生成更貼近上下文的對話內容,讓使用者在與小布助手的互動過程中,能夠對答如流,滿足使用者閒聊的需求,目前滿意度超過85%。

另外,虛擬人還需要展現出聲情並茂的面部表情和肢體語言。為此,OPPO透過ORTC窄帶高畫質、大規模低延時等基礎創新技術,依託小布助手的綜合AI能力,實現了在多個場景下與使用者的實時情感化互動,讓使用者於小布的互動不會因為計算處理、網路問題而卡頓,變得更加自然、真實。

基於這些硬核的AI能力,小布虛擬人才變得能聽會說、活靈活現,成為與使用者智趣相投的數字“生命體”。

第二重結界,從軟到硬的服務能力。

人類走向文明的體現,是學會使用工具來為自己服務。如果小布虛擬人只能停留在手機裡插科打諢,那和其他虛擬人也就沒什麼差異了。

如前所說,OPPO在內的硬體廠商早已不侷限於手機這一單品,都在發力多終端、多場景的智慧生活,這也使得消費者對於打破軟體和硬體之間的結界,用一個數字助手排程多種硬體的能力,有了迫切的需求。

用一個詞來總結,就是服務泛在化。具體有四大特性:人與裝置間的互動將更加自然無感,虛擬世界的真實渲染與現實趨於融合,多裝置無縫互聯互通,服務體驗隨人流轉。

對此,OPPO研究院院長劉暢認為,泛在服務的趨勢,對開發者和平臺提出了更高更全面的要求。

作為多端融合的服務排程工具,小布虛擬人也就具備了“軟硬服一體化”的差異化能力,給消費者帶來了實質性的體驗改變,也讓自己變得與眾不同、獨一無二。

面向未來的全新服務形態,小布虛擬人具體能做些什麼呢?

首先是感知,作為使用者與機器互動的入口,透過語音、視覺等多元化資訊融合感知,具備資料感知、資料採集的基本能力,為主動服務提供資料養料;

其次是計算,藉助AI大腦的計算分析處理引擎,將多維資訊綜合處理,化繁為簡變成高效服務傳達給使用者,讓無處不在的應用功能可以被高效觸達;

最後是生態,未來除了手機,平板、冰箱等各種帶屏裝置,都需要更具情感色彩的人機互動,這時候虛擬人生態的形成,可以匯聚開發者和IoT廠商,為消費者聯合打造千人千面的是虛擬人,讓有溫度的智慧服務無處不在。

從這個角度看,軟硬服一體化的小布虛擬人,也成為實現泛在服務、智慧生活時代的關鍵。

第三重結界,從應用到生態的支撐能力。

應對物競天擇,最好的方式是,形成一個龐大的物種生態。對於小布虛擬人來說,要給使用者提供更豐富、更多元的AI服務,無法依靠一家企業來獨立完成,需要引發使用者、開發者、合作伙伴們的多維互動和創意。

以往虛擬人的開發者是企業自身,為自有產品和服務提供支援,運營模式相對封閉。如何尋找更多場景啟用更多服務,成為虛擬人技術為使用者提供更多價值的前提,才能形成欣欣向榮的生態圖景。

生態的打造是一件複雜工程,開發者們的創意飛揚,也需要工具、資源、算力等底層支撐。從小布開發者平臺中可以看出,OPPO對開發者的支援可謂是誠意滿滿。

一方面,提供一站式、能力完備的平臺工具與服務。小布開發者平臺,以OPPO全棧式AI技術能力為底座,覆蓋了底層的資料和算力基礎,搭載了各類語音、對話、視覺、圖譜、多模態互動等AI基礎能力,上層各類平臺,如BVS語音服務、AIoT雲平臺、技能平臺、以及虛擬人定製平臺。讓裝置接入、虛擬形象定製、功能開發等都變得便捷高效,每一位開發者都能定製專屬的小布虛擬人。

另外,開放從軟體、硬體到服務的OPPO生態資源,助力“冷啟動”。以小布AIoT服務平臺BVS為例,就與IoT行業特別是智慧家居行業展開互動合作,IoT廠商的主控裝置如音響或控制皮膚,透過BVS可以快速接入小布智慧雲,開發者應用可以實現一次開發、多端觸達,開發出的虛擬人可以搭載在OPPO生態中多個智慧終端裝置上(電視、手機、手錶等帶屏裝置),收穫商業價值。

時代的考題與OPPO公式,開啟產業之變

對於開發者來說,萬物互融時代,既是潛力無限的金礦,也是一個充滿殘酷挑戰的競賽。

潛力在於,為使用者提供一致的多維多場景體驗,開發者能夠觸及更多場景,降低開發成本,收穫更大的認可和商業成功。

挑戰在於,虛擬人這樣的新物種也是頂級技術的綜合體,並且需要產業配套來推進,單打獨鬥的普通開發者很難找到適配自身的場景和突破口。

對於智慧終端品牌來說,與其自築城池,不如開放自己,成為產業變革的推動力,匯聚開發者的力量,建立新技術體系下的話語權和創新輸出能力。

從此次ODC大會中我們觀察到,OPPO在重度投入、賦能開發者上做得非常深入,思考得也很透徹,將其拆解為一道綜合考題。

智慧生活的一道加法題,S多維場景與O全鏈路運營,圍繞人的生活場景和行為習慣,OPPO將開放統一的連線框架,讓開發者具備給使用者全場景互聯互通的服務能力,實現全場景、全鏈路的服務最佳化,可以更容易、更高效、更精細地找到機會,擴充套件觸達使用者的廣度和深度。

人機互動的一道乘法題,T是OPPO主導的軟硬融合技術,小布能實現多終端、多模態的人機對話,打造人與裝置間更加自然無感的互動體驗,為開發者提供創新源動力,獲得必備的AI能力。

泛在智慧的一道乘積題。以OPPO 全棧式AI技術能力為底座,透過小布實現智慧裝置之間的萬物互融,開發者可以創作出定製化的虛擬人,和使用者之間進行更多形態的情感化交流,讓虛擬世界和真實世界之間的交流變得不再單調和枯燥,進而實現泛在智慧的指數級增長。

由此,也形成了下一代生態勢能公式NEPE =T(S+O)i生態模式。

在小布虛擬人身上,我們能看到這一公式的落地應用,真正達到了軟硬兼施、內外兼修,OPPO開闢出了一條全新的賽道,這將是產業改變的初始。

這也讓我們相信,只要技術不斷澆灌,智慧生活會在開發者的想象力中,向更深處進化,未來還無盡可能。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2839600/,如需轉載,請註明出處,否則將追究法律責任。

相關文章