AIGC的“含科量”與“含資量”

naojiti發表於2022-02-20

2014年的時候,我在網際網路企業裡做內容工作,當時業內很流行凱文·凱利的“一千個粉絲”理論,相信“找到一千個種子使用者,產品就能夠活下去”。

找到種子使用者幹嘛呢?核心KPI之一,就是鼓勵他們創造內容,提高平臺的UGC數量與質量。

普通人也輕鬆能創作的圖文短影片,用愛發電的同人衍生,極具創意的鬼畜影片……UGC(User-generated content使用者生產內容),以高效、豐富、多元的產出方式,和PGC(Professional-generated content專家生產內容)、OGC(Occupationally-generated Content職業生產內容)一起,讓網際網路數字內容呈現出前所未有的繁榮多彩。

一個時代有一個時代的主題,如今業內流行的內容生產模式,則是AIGC。

AI-generated content,字面意思是AI生產內容。AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有創始人認為,遊戲中匯入圖片生成模型的“捏臉系統”都是AIGC。

那麼問題來了,讓AI替人舞文弄墨,對話互動問答、創意寫作、生成詩歌圖文或是以假亂真的影片,不都是舊新聞了嚒,都屬於自然語言生成Natural Language Generation (NLG)的應用,是NLP自然語言處理技術的一大類任務,已經應用將近30年了。

怎麼突然就以AIGC的概念成為資本熱捧的物件呢?

故事恐怕還是要從“元宇宙”說起。

AIGC,到底生產的是什麼內容?

在內外網搜尋 “AIGC”時,精準匹配的是簡體中文資訊,而英文AI-generated content一詞,在海外平臺主要還是以自動化生成文字的NLG技術為主。所以,AIGC應該是一個在中國率先流行起來的專有名詞。

目前為止,與AIGC相關的創作型別主要有三種:

1.內容平臺的一種自動化作業方式,比如CCTV的AIGC平臺,就包括智慧採編、模板生成、畫質最佳化等等;部分語音類app,透過語音合成 (TTS)技術,提供文字自動轉語音的能力;流媒體平臺,透過演算法對畫面畫質進行最佳化,提高畫質晰度等等。

2. AI科研機構的多模態應用,實現內容生成。比如中科院自動化所的跨模態通用人工智慧平“紫東太初”,就能夠做到“以圖生音”“以音生圖”。百度文心大模型的“AI畫家”,則在前不久的元宵節,生成與地點相匹配的專屬畫作。

3. 科技企業及創業公司的數字人、虛擬人制作。透過自主開發、平臺開發等形式,合成全新的人物形象,與使用者開展互動。比如AI手語主播,透過AI演算法將文字轉化為手語資訊,為聽障朋友提供服務;品牌代言人,火星車數字人祝融號跟廣大使用者進行互動;虛擬偶像,透過生動的表情、動作、語言等展示才藝,與粉絲對話;以及智慧客服、遊戲陪玩等等。

透過上述AIGC應用,或許不難理解,為什麼NLG往往依靠誇張新聞點(比如deepfake)偶爾進入大眾視野,而AIGC一詞出道即爆紅了。

小紅靠捧,大紅靠命:AIGC的“含科量”有多高?

如前所說,自然語言生成NLG作為AI創作內容的一種主流方式,此前在大部分時間內都是行業內自娛自樂,偶爾憑藉“換臉”之類的奇趣新聞火一把,但僅此而已。

而AIGC這一概念,在當下能夠迅速走紅,可以說是時也、運也。

首先,深度學習技術本身不斷迭代,能夠生成更具個性化、擬人化的內容。

隨著自然語言處理技術的不斷髮展,近年來AI的閱讀理解創作能力進步飛快,已經達到了驚人的水平,技術成熟給了AIGC廣泛應用的基礎。

隨著AI模型GPT-3的問世,機器已經能夠達到人類小學的閱讀寫作水平,頂級AI企業的中文普通話識別準確率能夠達到98%以上,多語言、小語種、方言的識別率也不斷升級。此外,情感計算、因果計算、知識圖譜、元學習等多種技術開始被引入深度學習,大幅改善了人機互動的自然感。

這些新成果應用在內容創作上,就是大家能看到AI寫出更流利通順的文章、用更自然的音色去朗讀一本書、更聲情並茂地跟人對話、對使用者輸入的語句理解的更準確,一句話,終於開始擺脫“人工智障”的標籤了。

第二,AI基礎設施不斷髮展,多模態大模型的相繼成熟落地。

如果只是生成單一的內容,那麼AIGC或許還不至於讓見多識廣的大眾眼前一亮。而多模態大模型的出現,讓融合性創新成為可能。

多模態大模型,既需要具備NLP(自然語言理解)大模型、CV(計算機視覺)大模型等的能力,理解語言、視覺的內容,還要能夠跨模態生成全新的內容,由此帶來了非常多的創意空間。比如透過一部小說的文字描寫,生成故事畫面、人物形象、環境佈景等,可以幫助創作者大大節省時間。

正因如此,多模態大模型需要處理的資料型別多,規模量大,模型引數已經達到千億級別,需要龐大的算力來支撐。得益於全國多地對AI基礎設施的重視和建設,才能夠讓多模態應用達到比較好的效果,進而支撐AIGC創作業態的進一步發展。

此外,AI平臺化的生態搭建,以及充足廣闊的產業實踐空間。

大模型雖好,對於很多企業和創作者來說,想要自己從頭開發一套大模型用來進行AIGC既不經濟、也不現實。這時候,AI平臺化、民主化就變得至關重要。

去年推出的許多多模態大模型,如紫東太初、文心、M6等,都透過AI平臺進行開源,可以直接呼叫並透過雲端算力進行訓練。一些科技企業也將數字人技術開源開放,這些動作大大降低了企業和創業者的開發門檻,創作效率提升,進而助力高質量AIGC變得普及。

目前,南京、武漢等地,已經開始形成多模態應用的產業叢集。而千行百業的數字化、數字經濟的持續發展,也給予了AIGC前所未有的產業空間與實踐場景。比如此次受資本追捧的一些AIGC公司,就瞄準了“遊戲+AI”場景,透過演算法生成數字人、語言互動等方式,滿足玩家在虛擬世界中個性化、定製化的體驗需求。而更多的產業實踐,也會源源不斷地產生新的資料,推動演算法的迭代升級。

AI產業化和產業AI化的發展,當下已經能夠支援內容創作的大變革,AIGC的流行,自然也就水到渠成了。

“含資量”不低,警惕AIGC的虛火

AI創作的大行其道,是科技發展到一定水平後的必然現象。但資本熱捧,許多投融資訊息突如其來,卻給“AIGC”一詞添上了一種別樣的味道。

為什麼說是“突然”呢?如前所說,AI寫詩之類的NLG應用並不罕見,但一直沒有被以“AIGC”一詞整合包裝起來。2021年7月,一位股民詢問擁有虛擬數字技術開發業務的絲路視覺:在AIGC技術上是否有儲備或應用?結果被該企業發言人直接反問:啥是AIGC?顯然,當時“AIGC”一詞就連從事相關業務的企業高管都不熟悉。

而在某問答平臺上,關於“AIGC未來會扮演什麼樣的角色”的問題,只有一個回答,來自某投資機構,而該機構正是某AIGC沙龍的組織方,參與討論的創始人也主要描繪了一種核心的AIGC應用場景,那就是元宇宙。

而剛剛拿下千萬美金融資的某AI公司,正在佈局的AIGC領域也聚焦在虛擬人技術,為遊戲行業提供基於AI的智慧NPC、自動化QA、對話系統和AI陪玩。完成1億美元融資、由紅杉中國領投的某獨角獸,核心產品則是AI bot,表示希望作為虛擬世界的先鋒,圍繞元宇宙開展多維度的基建。

從這些脈絡中不難看出,AIGC技術本身很真實,但長期以來一直處於默默發展、偶爾出圈的狀態。能夠在近期快速成為一個風口、一種網紅概念,與元宇宙的爆火、資本的動向,不無關係。

在這個新故事中,一般會有如下邏輯:1.元宇宙需要很多數字人、需要個性化的數字環境;2.這些內容光靠人來開發週期太長,需要更高效的生產方式;3.AI的能力就是提質增效,適合用來創作;4.所以,AIGC有前途。

歸根結底就是,元宇宙要火了,AI能做。

AI能做是真,但元宇宙到底啥時候火,可就沒個準數了。

我們此前探討過,作為一個複雜龐大的技術叢集概念,元宇宙依賴很多技術的成熟,距離真正成型還很遙遠。在這一天到來之前,沒有人能清楚地定義什麼是元宇宙,自然也不可能量化出到底需要多少虛擬人、數字人。那麼,為了元宇宙而生的AIGC,到底價值幾何,可能就跟元宇宙一樣,是個見仁見智的玄學了。

既然AIGC的走紅是技術發展的產物,那麼它的上限,自然也要受到技術規律的約束。誠然,AI的發展給內容創作帶來了很多可能,但技術也決定了很多內容依然是AI無法做到的:

首先,AIGC的內容質量有待提升。

OpenAI用於編寫內容的通用GPT-3模型釋出之後,很多內容機構都基於它開發了相應的創作模型。目前來看,主要應用還是一些重複枯燥工作的自動化,以CCTV的AIGC平臺為例,主要是自動完成挖掘新聞熱點,將新聞報導資料進行深度關聯、輔助編輯選題策劃,基於模板快速生成海報圖片圖表,智慧生成內容標籤,修復歷史影片等等。

一些用於生成內容的AI編寫器,創作能力實在是不太行。要麼只能用於生成一些符合SEO(搜尋引擎最佳化)的營銷內容,比如YouTube影片標題、Facebook廣告標題、GoogleAds標題和描述、亞馬遜產品描述等等,主要是更通順地把關鍵詞堆疊在一起,你不會覺得某寶的寶貝標題就是一篇“大作”吧。

要麼是由機器學習黑匣子生成的部落格文章。對於這類文章,平臺們往往也會提醒,AI無法複製情感,沒有靈魂、同理心、經驗等細微差別。所以也會建議使用AIGC工具的創作者,僱用人類作家來校對這些工具建立的內容。

所以至少目前為止,AIGC能提供很多幫助,但還是無法取代人類創作者的。

這是我用一個海外AI一句話生成器寫出來的文章,可以說是前言不搭後語,大家給它打幾分呢?

其次,AIGC的互動能力還不夠自然。

雖說NLP技術有了極大的進步,人工智慧聊天機器人可以幫助企業與潛在客戶聊天、給轄區居民撥打電話、為電商平臺使用者提供售前售後諮詢服務……但想必大家依然還是能夠很明顯地區別出,對面到底是真人還是聊天機器人。反正我本人,如果需要完成一些複雜的交流和操作,都會一開始就輸入“人工客服”“找人工”等命令,而不是跟智慧客服在那裡“鬼打牆”。

目前,基於AI技術的人機互動還需要漫長的試錯、實踐、積累、迭代,更適用於一些重複率高、流程標準化、對專業度或靈活響應度沒那麼高的交流。比如在智慧音響裡跟主人閒聊,作為虛擬偶像滿足粉絲的基本情感互動需求,或是在電商場景裡作為主播“念稿子”直播帶貨。

這裡面其實已經有非常大的想象空間了,雖然距離“元宇宙”中那種“和真實的人一樣”的願景還有距離。

從應用前景來看,“含科量”滿滿的AIGC,開啟了內容創作的想象力,將會給包括虛擬人、數字人、圖文音影遊等各種應用創新帶來可能。

在廣闊的產業和個人消費市場,AIGC正等待著展翅高飛。而“含資量”不低的AIGC風口,當元宇宙的熱潮退卻後,又會有多少裸泳的人,就需要時間來告訴我們答案了。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2856551/,如需轉載,請註明出處,否則將追究法律責任。

相關文章