百度李士巖:兩年內每個人有望實現“數字人自由”

lumin1020發表於2022-01-17

元宇宙無疑是2 021 年的概念頂流,在巨頭下場 web 3.0 加速構建過程中,虛擬 數字人 作為元宇宙的場景入口與連線紐帶 備受矚目。 今年的江蘇 衛視 跨年晚會上, 周深與鄧麗君跨時空合唱《大魚》刷屏。

面對數字人展現出的眾多可能性, 2022年1月14日 ,百度科技沙龍 AI呀 我去 !》 第四期 數字人 為主題,為百餘位媒體、專家學者 展現了數字人產業 的全景

會上, 百度智慧雲AI人機互動實驗室負責人李士巖 基於多年經驗, 圍繞當前數字人產業的發展格局、技術難點和底層驅動力進行了系統分享。 李士巖表示, 虛擬數字人產業格局 中,提供建模、渲染、動態捕捉等服務於數字人制作的基礎設施服務商已形成穩固格局,大多由海外巨頭把持 工具、應用 中國 企業 已開始 嶄露頭

不過, 數字人規模化落地還面臨三大難點:產業鏈割裂、服務場景與演藝場景沒有有效打通、滿足高頻需求成本高。 為系統解決這些難題, 百度推出數字人平臺“曦靈”, 未來 數字人生產、內容創作、業務配置服務 將可以在一個平臺上 實現全鏈路 製作 調優, 降本增效 “我們近兩年的奮鬥目標是 通過百度智慧雲曦靈平臺的開放,讓每個人實現數字人自由。” 李士巖 表示

數字人大規模落地要突破三大 難題

目前, 數字人 經歷 以“紙片人”為代表的1 .0 階段, Vtuber 主播為代表的2 .0 時代,已進化至 3 .0 階段 具備 模型 高精 人工智慧驅動 特點 的數字人 3 .0 成為 行業 主流。

李士巖介紹,第三代數字人 的建模和內容生產均有A I 參與, 使得數字人 的製作效率更高,也更智慧,能面向更多應用場景 可面向全群體 使用者,可由視訊、直播、chatbot等載體承載,更具備千人千面的互動 能力。

數字人3 .0 展現出 巨大 市場空間 根據次元光譜不完全統計,2021年國內虛擬偶像/數字人領域裡至少發生19筆融資 2 021 產業上下游 紛紛從自己擅長的角度切入市場

虛擬數字人產業格局 提供建模、渲染、動態捕捉等 服務於數字人制作的 基礎設施 服務商 已形成穩固格局,大多由海外巨頭把持 。不過, 工具 、應用 中國 企業 開始 嶄露頭

中國企業中, 數量最多 的是資產製作和策劃運營類的公司, 比如 推出超寫實數字人 AYAYI 燃麥科技 推出虛擬人物柳夜熙 創壹視訊 ,但 這類公司 面臨的挑戰是 門檻較低 可替代性高

此外, 掌握技術和場景的 網際網路公司則 扮演 綜合性技術 服務商的角色, 一邊推出基於自身優勢場景的數字人 打造應用標杆 一邊推出數字人平臺 將產品繼續落地到更細化的場景中,點、線互相推進。

李士巖 表示, 數字人 產業有 三大核心推動力 第一級 火箭是 使用者需求與技術升級 第二級 政策支援與資本湧入 第三級 算平臺的迭代

每一次數字人發展本質上 是技術推動的 使用者從平面的圖文影音獲取資訊 與互動, 向實時3 D 互動 反饋 需求 轉變 ,將成為數 字人長期發展的根本動能, 未來也 將創造大量需求。 “李士巖說。

雖然數字人行業擁有 強勁的驅動力, 李士巖 認為, 當下國內數字人 規模產業落地 面臨 三大 難題

首先 數字人產業鏈 各個節點相對割裂,不能高效協同 導致數字人在製作和調優上存在較高壁壘 目前行業中大多數公司 只是 數字人制作與運營全流程上的一環或其中幾環 其次 服務場景與演藝場景沒有有效打通 表現為演藝型數字人不具備客戶所需的業務能力,而服務型數字人缺乏人設 難以與使用者進行情感交流 第三是 滿足高機動性、高頻需求 成本 依舊很高 ,這一問題歸根結底還是數字人的生產效率問題

百度推出數字人平臺“曦靈”

面對 當前 數字人 製作 的高門檻 2 021 年1 2 百度create大會(百度 AI 開發者大會)上,百度 CTO 王海峰正式釋出了“ 百度智慧雲曦靈 數字人平臺  搭建集 數字人生產、內容創作、業務配置服務為一體的平臺級產品 目前 該產品已 具備標準平臺的快速交付能力,幫助不同領域客戶快速實現敏捷型需求,降本增效。 百度的數字人平臺 曦靈具有全場景、一站式、平臺化的特點, 能支援 從最初數字人形象定製、人設管理再到業務編排、內容創作,最後到多種驅動模式下與使用者互動 的全部需求 這也意味著 在一個平臺上即可 實現數字人的全鏈路調優,從而將效果做到最好。

李士巖以 數字人 生成環節 為例, 演示了百度智慧雲曦靈平臺的功能。 使用者在百度智慧雲曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數字人像,以前需要兩三個月時間做出來的3D數字人,現在可以壓縮到 小時級 ,同時 還可以通過 一句話 語音 描述或簡單 捏臉等多種形式 快速 生產數字人 數字人個性化功能開發也較之前更加完善,以百度剛剛釋出的3D超寫實口語數字人為例,其口型合成準確率高達98.5%。

在技術催生的數字人3 .0 階段,虛擬人可與不同行業產生更緊密的融合。基於市場使用場景,數字人 可以 分為 演藝型數字人 服務型數字人 兩類

演藝術型數字人包括虛擬主播、虛擬偶像以及數字孿生的虛擬品牌代言人。目前百度已經打造了 A I 手語主播、央 視網虛擬主持人小C、航天局火星車數字人祝融號、百度 虛擬代言人 希加加、百度 A PP 代言人龔俊 數字人

服務型數字人包括數字員工、虛擬員工、虛擬業務員等 可以幫助金融、運營商、政府、零售等行業提供基於數字人的新一代客戶服務能力,解決排隊長、回應慢、人力成本大等問題。 目前,百度已經和浦發銀行、光大銀行、中國聯通合作,推出了一對一服務型數字人。

百度在數字人技術上的 突破也得益於其在行業內的 持續佈局。早在2019年,百度就開始了“虛擬數字人戰略” 基於多年的AI技術沉澱, AI能力已成為百度智慧雲曦靈平臺的核心能力,現在百度也 把這種能力開放給外界。

李士巖 表示 “我們近兩年的奮鬥目標是通過百度智慧雲曦靈平臺的開放,讓每個人實現數字人自由。”


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69965512/viewspace-2852544/,如需轉載,請註明出處,否則將追究法律責任。

相關文章