Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

MissD 發表於 2022-01-15

剛剛過去的 2021 年,元宇宙概念爆火到一度“出圈”成了頂流。在全球科技巨頭紛紛下場、web 3.0 加速構建的過程中,虛擬數字人作為元宇宙的場景入口與連線紐帶也備受矚目。剛剛舉辦的江蘇衛視跨年晚會上,周深與鄧麗君跨時空合唱《大魚》在全網刷屏。面對數字人展現出的眾多可能性,2022 年 1 月 14 日,百度科技沙龍《AI 呀,我去!》第四期以數字人為主題,為百餘位媒體、專家學者展現了數字人產業的全景。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

本次活動上,百度智慧雲 AI 人機互動實驗室負責人李士岩基於多年經驗,圍繞當前數字人產業的發展格局、技術難點和底層驅動力進行了系統分享。李士巖表示,虛擬數字人產業格局中,提供建模、渲染、動態捕捉等服務於數字人制作的基礎設施服務商已形成穩固格局,大多由海外巨頭把持,但在工具、應用層,中國企業已開始嶄露頭角。

儘管如此,數字人規模化落地還面臨三大難點:產業鏈割裂、服務場景與演藝場景沒有有效打通、滿足高頻需求成本高。為系統解決這些難題,百度推出數字人平臺“曦靈”,未來數字人生產、內容創作、業務配置服務將可以在一個平臺上實現全鏈路製作和調優,降本增效。“我們近兩年的奮鬥目標是,通過百度智慧雲曦靈平臺的開放,讓每個人實現數字人自由。”李士巖表示。

數字人大規模落地要突破三大難題

目前,數字人經歷了以“紙片人”為代表的 1.0 階段,以 Vtuber 主播為代表的 2.0 時代,已進化至3.0階段,具備模型高精、人工智慧驅動特點的數字人 3.0 成為行業主流。李士巖介紹,第三代數字人的建模和內容生產均有 AI 參與,這使得數字人的製作效率更高,也更智慧,能面向更多應用場景。可面向全群體使用者,可由視訊、直播、chatbot 等載體承載,更具備千人千面的互動能力。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

現階段,數字人 3.0 已展現出巨大的市場空間。根據次元光譜不完全統計,2021 年國內虛擬偶像/數字人領域裡至少發生 19 筆融資,2021 年產業上下游也紛紛從自己擅長的角度切入市場。虛擬數字人產業格局中,提供建模、渲染、動態捕捉等服務於數字人制作的基礎設施服務商已形成穩固格局,大多由海外巨頭把持。不過,在工具、應用層,中國企業已開始嶄露頭角。

中國企業中,數量最多的是資產製作和策劃運營類的公司,比如推出超寫實數字人的 AYAYI 燃麥科技,推出虛擬人物柳夜熙的創壹視訊,但這類公司面臨的挑戰是門檻較低、可替代性高。此外,掌握技術和場景的網際網路公司則扮演綜合性技術服務商的角色,一邊推出基於自身優勢場景的數字人,打造應用標杆;一邊推出數字人平臺,將產品繼續落地到更細化的場景中,點、線互相推進。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

李士巖表示,數字人產業有三大核心推動力,第一級火箭是使用者需求與技術升級、第二級是政策支援與資本湧入、第三級是計算平臺的迭代 —— “每一次數字人發展本質上都是技術推動的,使用者從平面的圖文影音獲取資訊與互動,向實時 3D 互動反饋的需求轉變,將成為數字人長期發展的根本動能,未來也將創造大量需求。“

雖然數字人行業擁有強勁的驅動力,但李士巖認為,當下國內數字人要大規模產業落地還面臨三大難題。

首先,數字人產業鏈各個節點相對割裂,不能高效協同,導致數字人在製作和調優上存在較高壁壘,目前行業中大多數公司只是數字人制作與運營全流程上的一環或其中幾環。其次,服務場景與演藝場景沒有有效打通,表現為演藝型數字人不具備客戶所需的業務能力,而服務型數字人缺乏人設,難以與使用者進行情感交流。第三是滿足高機動性、高頻需求的成本依舊很高,這一問題歸根結底還是數字人的生產效率問題。

百度推出數字人平臺“曦靈”

面對當前數字人制作的高門檻,在 2021 年 12 月底舉辦的百度 create 大會(百度 AI 開發者大會)上,百度 CTO 王海峰正式釋出了“百度智慧雲曦靈數字人平臺”, 搭建集數字人生產、內容創作、業務配置服務為一體的平臺級產品。目前該產品已具備標準平臺的快速交付能力,幫助不同領域客戶快速實現敏捷型需求,降本增效。百度的數字人平臺曦靈具有全場景、一站式、平臺化的特點,能支援從最初數字人形象定製、人設管理再到業務編排、內容創作,最後到多種驅動模式下與使用者互動的全部需求,這也意味著在一個平臺上即可實現數字人的全鏈路調優,從而將效果做到最好。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

李士巖以數字人生成環節為例,演示了百度智慧雲曦靈平臺的功能。使用者在百度智慧雲曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的 2D 數字人像,以前需要兩三個月時間做出來的 3D 數字人,現在可以壓縮到小時級,同時還可以通過一句話語音描述或簡單捏臉等多種形式快速生產數字人。數字人個性化功能開發也較之前更加完善,以百度剛剛釋出的 3D 超寫實口語數字人為例,其口型合成準確率高達 98.5%。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

在技術催生的數字人 3.0 階段,虛擬人可與不同行業產生更緊密的融合。基於市場使用場景,數字人可以分為演藝型數字人、服務型數字人兩類。

演藝術型數字人包括虛擬主播、虛擬偶像以及數字孿生的虛擬品牌代言人。目前百度已經打造了 AI 手語主播、央視網虛擬主持人小 C、航天局火星車數字人祝融號、百度虛擬代言人希加加、百度APP代言人龔俊數字人。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

服務型數字人包括數字員工、虛擬員工、虛擬業務員等,可以幫助金融、運營商、政府、零售等行業提供基於數字人的新一代客戶服務能力,解決排隊長、回應慢、人力成本大等問題。目前,百度已經和浦發銀行、光大銀行、中國聯通合作,推出了一對一服務型數字人。

Web3.0時代 | 數字人如何突破規模落地三大難點? 百度李士巖:兩年內每個人有望實現“數字人自由”

百度在數字人技術上的突破,得益於其在行業內的持續佈局。早在 2019 年,百度就開始了“虛擬數字人戰略”。基於多年的 AI 技術沉澱, AI 能力已成為百度智慧雲曦靈平臺的核心能力,現在百度也在把這種能力開放給外界。李士巖表示,“我們近兩年的奮鬥目標是通過百度智慧雲曦靈平臺的開放,讓每個人實現數字人自由。”