“虛擬人”元年到來:期待另一個“你”嗎?

新闻助手發表於2021-08-26

“在未來的世界裡,真實世界裡的每個東西都會有一個晶片,整個世界都將被數字化,一切都將在虛擬數字世界裡有一個複製品,像是現實世界的一面鏡子。” 這是《失控》作者凱文·凱利對網際網路之後未來三十年科技發展趨勢的預測。也許人類暫時還無法體會這樣一個充滿科幻色彩的“映象世界”,但2021年以來“虛擬人”呈現出的火熱態勢,似乎宣告著“映象的人”、甚至“另一個你”正在到來。

最近,韓國人工智慧公司Pulse 9推出了一個完全由AI打造的韓國流行音樂女團Eternity,共包含11位AI成員,由該公司研發的“Deep Real”技術打造。雖然網友紛紛吐槽“效果一般”“摳圖感爆表”,但這個特殊的“虛擬女團”還是引起了大家的熱捧,其單曲MV“I’m Real”在YouTube上的播放量達到67萬。

“虛擬人”元年到來:期待另一個“你”嗎?

“虛擬人女團”Eternity

今年6月,由清華大學計算機系、北京智源研究院、智譜AI和小冰公司聯合“培養”的國內首個原創“虛擬學生”華智冰入學清華,該事件引發社會熱議。其背後依託的是全球最大的超大規模智慧模型“悟道2.0”和人工智慧小冰框架。

“虛擬人”元年到來:期待另一個“你”嗎?

華智冰形象。她的臉部、聲音都透過人工智慧模型生成。

時間再往前推,2019年央視網路春晚舞臺上,撒貝南虛擬孿生兄弟“小小撒”登臺,拿起話筒掌控現場,妙語連珠,以至於一旁的小撒“委屈”插話:“能給我說一句嗎?”據介紹,在AI技術的基礎上打造這樣一個小小撒,只需撒貝南等主持人的面部掃描和半小時的錄音資料,即可生成形象和聲音模型。

事實上,近些年,虛擬歌手、虛擬主播、虛擬老師、虛擬客服、虛擬導遊……各種虛擬角色層出不窮地出現在社會大眾生活中,騰訊、搜狗、三星……國內外科技巨頭紛紛入局“造人”。2021年初,百度研究院釋出了2021年十大科技趨勢預測,提到虛擬人將大批次出現,業界認為2021年是“虛擬人”元年。面對強勁而來的“虛擬人”,我們不禁疑惑,“虛擬人”從何而來?距離我們的生活到底有多遠?又將帶領人類生活去往何地?

“虛擬人”不同於“虛擬偶像”和“數字人”,是人工智慧的前沿表現

如今層出不窮的“虛擬人”總是與人工智慧密不可分,那些“炙手可熱”的“虛擬人”背後也總是離不開人工智慧技術的加持。但很多人不知道,“虛擬人”在誕生之初並不是人工智慧的“代言人”,而是適應影視娛樂需求、基於動畫和3D技術而產生。

80年代,日本動畫《超時空要塞》出現了虛擬歌姬林明美,同時代由英國人創作的虛擬人Max Headroom也拍攝了多部電影和廣告片。此後,在影視娛樂業,“虛擬人”的發展分化為兩條路徑,二次元“虛擬偶像”和 “數字人”。

“虛擬偶像”中最成功、最具代表性的要屬“初音未來”。2007年,被稱為“虛擬偶像帝國開創者”的初音未來隨著一款音樂軟體誕生,她穿著短裙,有著兩條蔥綠色馬尾,是一個形象軟萌的“二次元少女”。這款音樂軟體僅僅兩週就賣出了3500多份,一年後更是賣到了4.2萬份。2009年,初音未來迎來了人生巔峰,在東京舉辦了2週年演唱會,成為世界上第一個使用全息投影技術舉辦演唱會的虛擬偶像。

初音未來之後,更多“虛擬偶像”在全球不同地方紛紛崛起。2012年,上海禾念採用與初音未來類似的運營手法推出了虛擬歌手洛天依,成為中國最早實現盈利的“虛擬偶像”。

不同於以語音合成程式和全息投影技術為基礎的“虛擬偶像”,“數字人”主要用於影視特效,簡單來說,“數字人”就是逼真的3D人體模型。3D模型可以理解為遊戲或電影中經常看到的數字木偶假人,“數字人”則是一個複雜的3D人體模型,它利用最新開發的高階功能在外觀(皮膚著色或毛髮梳理上)和運動(準確的繫結和動畫)方面產生逼真的效果。

“虛擬人”由“虛擬偶像”和“數字人”發展而來,但 “虛擬偶像”與“數字人”卻並不等同於“虛擬人”。近幾年,得益於深度學習演算法的突破,“虛擬人”逐漸與其他相近概念區分開來,步入自己的發展軌道。根據中國人工智慧產業發展聯盟和中關村數智人工智慧產業聯盟數字人工作委員會發布的《2020年虛擬數字人發展白皮書》,人工智慧成為“虛擬人”不可分割的工具,智慧驅動成為“虛擬人”最顯著的特點。

IMG_256

騰訊AI Lab推出的唱作人“艾靈”

從初音未來、洛天依與“艾靈”的對比中能夠更直觀地理解智慧驅動的“虛擬人”。初音未來等“虛擬偶像”實質上並不是人工智慧的產物,而是依託於“機器合成+人工調教”模式,如果缺乏了人工調教的過程,虛擬歌姬的演唱只是一堆電子音的集合,不會有富有感情的歌唱技巧。在貼吧中,也曾有網友吐槽“洛天依很難調教,因為需要一個音一個音去修改”。對比之下,騰訊AI Lab在2020年推出基於DurIAN聲學模型的唱作人“艾靈”,以AI取代人工調教的艱難過程,讓“艾靈”直接學會人類的歌唱技巧。

人工智慧驅動了“虛擬人”的發展,“虛擬人”也成為了人工智慧技術的前沿表現形式。正如產業時評人張書樂所說,“虛擬人”將人工智慧人格化,是一種形象生動、易被大眾感知且具備話題性的表現形式,這對於人工智慧公司來說,是展現自己技術實力的優質工具。同時,“虛擬人”也可以作為品牌形象展示,並且人設會隨著技術迭代而不斷豐滿,其可能展示的技術實力也比單純的營銷路數更強,比如小冰創作詩歌、小說,參與一系列人機互動之類,讓人感受到深度學習的進步,也標誌著人工智慧從工業化層面進階到“虛擬人”.

“虛擬人”的影視造夢路越走越窄

但受困於技術發展與應用場景的侷限,現階段“虛擬人”的生存之道仍在探索中。由於“虛擬人”由早期影視娛樂業的“虛擬偶像”、“數字人”疊加人工智慧技術而誕生,在致力於為觀眾“造夢”的目標上,影視行業和“虛擬人”也頗為一致,因此最先對“虛擬人”敞開懷抱的是影視娛樂業。

2015年,臺北小巨蛋舉辦《如果能許一個願望·鄧麗君20週年虛擬人紀念演唱會》,虛擬“鄧麗君”在臺上唱著《甜蜜蜜》,臺下7000名真實世界中的歌迷聽得如痴如醉,作為表演嘉賓的費玉清還與鄧麗君“同臺”對唱。這場給輿論帶來極大震動的演唱會,依靠的是數字王國的虛擬人像技術。

IMG_256

數字王國推出虛擬“鄧麗君”演唱會

自此以後,娛樂、特效、人工智慧行業都盯上了“虛擬人”的 “偶像生意”。2019年網路春晚,虛擬主持人“小小撒”的出場讓觀眾高呼“最時髦的網路春晚”,“小小撒”原名叫做湃(PAI),是美國AI公司偶邦(ObEN)研發的一款新型人工智慧主持人。根據偶邦創始人介紹,虛擬主持人可以透過視覺和聲音兩方面來進行自我學習,更立體、更真實地還原主持人。

2020年11月,韓國最大的娛樂公司SM娛樂推出女團Aespa,這是韓國首個以真實和虛擬偶像為主角的流行組合。組合包括四個人類成員和他們相應的AI化身。SM公司發言人宣稱計劃開發這樣的人工智慧技術,旨在用於能與粉絲進行更加個性化的互動,而這些互動人類可能無法完成。他舉了一個例子,虛擬偶像可以拜訪粉絲的家,在他們工作時陪伴他們,甚至成為粉絲的“朋友”。

IMG_256

魔琺科技推出國風虛擬KOL –翎

與韓國的造星模式不同,中國試圖為“虛擬人”注入更多文化因素。2021年1月,國風虛擬KOL –翎登上央視綜藝《上線吧!華彩少年》, 並現場表演了一首經典京劇選段《天女散花》, 翎的聲音來自京劇梅派第三代傳人,在與眾多評委的互動中,翎闡述了自己對於國粹以及中國傳統文化的深度理解。翎由魔琺科技與次世文化聯手打造,結合了魔琺科技原創人工智慧技術在虛擬人和虛擬內容智慧化製作方面的優勢,以及次世文化在跨次元內容開發及運營領域的精準把控。出道以來,翎以獨特的形象和極具風格化的內容吸引了眾多使用者的喜愛,並與眾多知名品牌如特斯拉、奈雪的茶等進行了跨界合作。

“虛擬人”在影視娛樂行業中看似擁有巨大流量,但大多數虛擬偶像的發展也僅止步於“出道”一瞬間的吸睛,譬如女團Aespa出道之後的4個月中,虛擬分身們只在出道MV中出現過,距離成為陪伴粉絲的“朋友”,似乎還有很長的路要走。

這條路也是虛擬偶像的商業變現之路,成為困擾行業發展的難題,例如上海禾念旗下眾多的虛擬人IP中僅有洛天依等少數幾個能夠保持盈利。即便是虛擬“鄧麗君”演唱會取得萬人空巷的成功,但持續變現能力依然困擾著數字王國,究其原因,“虛擬人”尚未迎來底層技術的真正質變。

“虛擬人”進入各行各業,技術突破路徑越發清晰

雖然技術尚未突破,但整個市場對於“虛擬人”的期待與日俱增,商業落地並未受到實質性影響,各行各業都在尋求更加豐富的落地場景。在傳統的娛樂場景中,“虛擬人”已經不再固守演唱會等變現思路,轉而主動尋求與旅遊、文創等其他場景深度融合,虛擬“鄧麗君”與重慶洪崖洞景區合作,推出的全息MR互動音樂秀《尋找鄧麗君》,成為源源不斷吸引旅遊者和提升遊客好感度的地標式節目。

在金融領域,“虛擬人”似乎也找到了用武之地。2019年7月,百度智慧雲與浦發銀行聯合打造虛擬員工“小浦”,表現為螢幕中的3D形態,其外形,表情、動作形態逼真,語調、語氣、說話風格自然流暢,還能透過多感官實時關注和識別使用者的情緒、表情、語氣,根據對話內容及時作出反應,並透過深度學習技術具備各行業專業知識。 作為實習生,“小浦”跟從多年榮獲浦發最佳理財經理的師傅們學習,5個月後成為浦發銀行正式員工,在浦發銀行的部分網點進行輪崗。

IMG_256

2019百度AI開發者大會現場,李彥宏與數字人“小浦”互動

中國信通院雲端計算與大資料研究所工程師顏媚指出,“虛擬人”是新型的人機互動應用,目前產業界各方都在積極探索相關的應用場景,突出的代表包括金融領域的智慧客服、電商領域的直播帶貨、電信領域的影片問答、教育領域的虛擬教師,以及傳媒領域的虛擬主播等。總體來看,具有兩個應用方向:一是降本增效,一是提升使用者感知與體驗。

但要實現這一目標,“虛擬人”必須實現技術突破,接近甚至超越人類智慧水平,針對這一目標,業內在技術發展路徑方面已經有了統一的方向。人工智慧的核心之一是學習,當前普通機器學習模型的訓練過程將大量資料透過演算法進行訓練,訓練成的模型無法改變,如果應用場景稍有變化的話,就會表現的“不夠智慧”。而人學習基礎知識之後,在各種場景下應用,再接受新的反饋,形成不斷學習的過程,基於此方向預訓練大模型“悟道”正在試圖給出答案。

今年6月,依託“悟道2.0”誕生的中國首個原創虛擬學生“華智冰”釋出,華智冰導師、清華大學計算機系教授唐傑表示,“悟道2.0”是“資料”和“知識”雙輪驅動,旨在讓機器能夠像人一樣思考,實現超越圖靈測試的機器認知能力。

“悟道”在打造資料驅動的大模型時仿照人的學習過程,以大量的自然語言、圖片等多模態資料用來訓練,其引數規模達到1.75萬億,是目前中國首個、全球最大的萬億級模型;之後透過以知識圖譜技術為核心的知識驅動系統,以及邏輯推理計算引擎以任務為導向讓“華智冰”的能力發揮出來,讓它像人一樣有思考的能力。

從1.0進階到2.0,“悟道”的升級表現為知識的融入、資料的增加、模型的規模擴大、能力的提升、應用的場景擴充,之後的3.0版本會再上一個臺階,最終將“華智冰”打造成為一款不僅可以作詩作曲,生成圖畫,還將具有一定的推理和情感互動能力,同時擁有持續學習能力的“虛擬人”。

可以預見,“虛擬人”的成長路徑即憑藉超大規模的多模態資料,配合更加完整的知識驅動系統與邏輯推理計算引擎,“真正虛擬人”即將到來。

“虛擬人”是對人類能力的全方位延伸

關於“虛擬人”對人類生活的價值,奇點大學校長、谷歌工程總監、暢銷書《人工智慧的未來》作者雷·庫茲韋爾曾在一篇文章中寫道:數千年前,人類無法摘到高處樹枝上的水果,因此發明出了能夠延伸人類所及範圍的工具;後來,人類又創造出了能夠增強肌肉力量的工具;今天,人類只需要敲幾下鍵盤,便可以訪問人類所有的現有知識。當代人工智慧不再只是屬於少數幾個富有公司或政府組織的特權,而是數十億普通人的權利,人類延伸了其身體和精神的所及範圍,這種延伸將繼續發展,直到人類級別的人工智慧成為現實。

當“虛擬人”成為現實時,人類的生產力將跨越到一個新的階段。人類藉助工具對自身力量的延伸,將從肢體所及範圍、肌肉力量等物理層面跨越到精神層面。因此,從這個角度出發,“虛擬人”的誕生和發展或許具有“劃技術時代”的重要價值。這聽起來很遙遠,其實現實中已經出現一些案例,能夠讓我們一窺由“虛擬人”揭開的未來。

image.png

NEON不會每次微笑模樣都一模一樣。

在CES 2020上,韓國三星STAR Labs正式展出了人工智人(Artificial Human)專案NEON,與以往“虛擬人”不同的是,它能夠像真人一樣快速響應對話,做出真實的表情神態。例如微笑這樣的表情,NEON不會每次微笑模樣都一模一樣,因為它可以構建機器學習模型,在對人物原始聲音、表情等資料進行捕捉並學習之後,形成像人腦一樣的長期記憶......

想象一下,未來的某一天,早上8點起床,虛擬助理已經幫你搭配好了早餐,並在你享用早餐時向你介紹今日安排和社交資訊;9點,你來到辦公室,將制定好的方案交給虛擬同事,模擬執行,預估方案的可行性和效果;中午12點,你走進餐廳,虛擬服務員為你提供點餐服務;晚上8點,在虛擬教練的指導下,你足不出戶就完成了一套專業健身訓練。更不可思議的是,你也可以擁有自己的虛擬分身,出差時,你的虛擬分身會幫你照顧好家庭,為孩子準備一如三餐、輔導家庭作業……

這樣的“虛擬人”未來世界,你期待嗎?

(撰稿:宋佳)

(注:本文圖片均來自於網際網路,如涉侵權,立即刪除。)


相關文章