AIGC的“含科量”與“含資量”
2014年的時候,我在網際網路企業裡做內容工作,當時業內很流行凱文·凱利的“一千個粉絲”理論,相信“找到一千個種子使用者,產品就能夠活下去”。
找到種子使用者幹嘛呢?核心KPI之一,就是鼓勵他們創造內容,提高平臺的UGC數量與質量。
普通人也輕鬆能創作的圖文短影片,用愛發電的同人衍生,極具創意的鬼畜影片……UGC(User-generated content使用者生產內容),以高效、豐富、多元的產出方式,和PGC(Professional-generated content專家生產內容)、OGC(Occupationally-generated Content職業生產內容)一起,讓網際網路數字內容呈現出前所未有的繁榮多彩。
一個時代有一個時代的主題,如今業內流行的內容生產模式,則是AIGC。
AI-generated content,字面意思是AI生產內容。AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有創始人認為,遊戲中匯入圖片生成模型的“捏臉系統”都是AIGC。
那麼問題來了,讓AI替人舞文弄墨,對話互動問答、創意寫作、生成詩歌圖文或是以假亂真的影片,不都是舊新聞了嚒,都屬於自然語言生成Natural Language Generation (NLG)的應用,是NLP自然語言處理技術的一大類任務,已經應用將近30年了。
怎麼突然就以AIGC的概念成為資本熱捧的物件呢?
故事恐怕還是要從“元宇宙”說起。
AIGC,到底生產的是什麼內容?
在內外網搜尋 “AIGC”時,精準匹配的是簡體中文資訊,而英文AI-generated content一詞,在海外平臺主要還是以自動化生成文字的NLG技術為主。所以,AIGC應該是一個在中國率先流行起來的專有名詞。
目前為止,與AIGC相關的創作型別主要有三種:
1.內容平臺的一種自動化作業方式,比如CCTV的AIGC平臺,就包括智慧採編、模板生成、畫質最佳化等等;部分語音類app,透過語音合成 (TTS)技術,提供文字自動轉語音的能力;流媒體平臺,透過演算法對畫面畫質進行最佳化,提高畫質晰度等等。
2. AI科研機構的多模態應用,實現內容生成。比如中科院自動化所的跨模態通用人工智慧平“紫東太初”,就能夠做到“以圖生音”“以音生圖”。百度文心大模型的“AI畫家”,則在前不久的元宵節,生成與地點相匹配的專屬畫作。
3. 科技企業及創業公司的數字人、虛擬人制作。透過自主開發、平臺開發等形式,合成全新的人物形象,與使用者開展互動。比如AI手語主播,透過AI演算法將文字轉化為手語資訊,為聽障朋友提供服務;品牌代言人,火星車數字人祝融號跟廣大使用者進行互動;虛擬偶像,透過生動的表情、動作、語言等展示才藝,與粉絲對話;以及智慧客服、遊戲陪玩等等。
透過上述AIGC應用,或許不難理解,為什麼NLG往往依靠誇張新聞點(比如deepfake)偶爾進入大眾視野,而AIGC一詞出道即爆紅了。
小紅靠捧,大紅靠命:AIGC的“含科量”有多高?
如前所說,自然語言生成NLG作為AI創作內容的一種主流方式,此前在大部分時間內都是行業內自娛自樂,偶爾憑藉“換臉”之類的奇趣新聞火一把,但僅此而已。
而AIGC這一概念,在當下能夠迅速走紅,可以說是時也、運也。
首先,深度學習技術本身不斷迭代,能夠生成更具個性化、擬人化的內容。
隨著自然語言處理技術的不斷髮展,近年來AI的閱讀理解創作能力進步飛快,已經達到了驚人的水平,技術成熟給了AIGC廣泛應用的基礎。
隨著AI模型GPT-3的問世,機器已經能夠達到人類小學的閱讀寫作水平,頂級AI企業的中文普通話識別準確率能夠達到98%以上,多語言、小語種、方言的識別率也不斷升級。此外,情感計算、因果計算、知識圖譜、元學習等多種技術開始被引入深度學習,大幅改善了人機互動的自然感。
這些新成果應用在內容創作上,就是大家能看到AI寫出更流利通順的文章、用更自然的音色去朗讀一本書、更聲情並茂地跟人對話、對使用者輸入的語句理解的更準確,一句話,終於開始擺脫“人工智障”的標籤了。
第二,AI基礎設施不斷髮展,多模態大模型的相繼成熟落地。
如果只是生成單一的內容,那麼AIGC或許還不至於讓見多識廣的大眾眼前一亮。而多模態大模型的出現,讓融合性創新成為可能。
多模態大模型,既需要具備NLP(自然語言理解)大模型、CV(計算機視覺)大模型等的能力,理解語言、視覺的內容,還要能夠跨模態生成全新的內容,由此帶來了非常多的創意空間。比如透過一部小說的文字描寫,生成故事畫面、人物形象、環境佈景等,可以幫助創作者大大節省時間。
正因如此,多模態大模型需要處理的資料型別多,規模量大,模型引數已經達到千億級別,需要龐大的算力來支撐。得益於全國多地對AI基礎設施的重視和建設,才能夠讓多模態應用達到比較好的效果,進而支撐AIGC創作業態的進一步發展。
此外,AI平臺化的生態搭建,以及充足廣闊的產業實踐空間。
大模型雖好,對於很多企業和創作者來說,想要自己從頭開發一套大模型用來進行AIGC既不經濟、也不現實。這時候,AI平臺化、民主化就變得至關重要。
去年推出的許多多模態大模型,如紫東太初、文心、M6等,都透過AI平臺進行開源,可以直接呼叫並透過雲端算力進行訓練。一些科技企業也將數字人技術開源開放,這些動作大大降低了企業和創業者的開發門檻,創作效率提升,進而助力高質量AIGC變得普及。
目前,南京、武漢等地,已經開始形成多模態應用的產業叢集。而千行百業的數字化、數字經濟的持續發展,也給予了AIGC前所未有的產業空間與實踐場景。比如此次受資本追捧的一些AIGC公司,就瞄準了“遊戲+AI”場景,透過演算法生成數字人、語言互動等方式,滿足玩家在虛擬世界中個性化、定製化的體驗需求。而更多的產業實踐,也會源源不斷地產生新的資料,推動演算法的迭代升級。
AI產業化和產業AI化的發展,當下已經能夠支援內容創作的大變革,AIGC的流行,自然也就水到渠成了。
“含資量”不低,警惕AIGC的虛火
AI創作的大行其道,是科技發展到一定水平後的必然現象。但資本熱捧,許多投融資訊息突如其來,卻給“AIGC”一詞添上了一種別樣的味道。
為什麼說是“突然”呢?如前所說,AI寫詩之類的NLG應用並不罕見,但一直沒有被以“AIGC”一詞整合包裝起來。2021年7月,一位股民詢問擁有虛擬數字技術開發業務的絲路視覺:在AIGC技術上是否有儲備或應用?結果被該企業發言人直接反問:啥是AIGC?顯然,當時“AIGC”一詞就連從事相關業務的企業高管都不熟悉。
而在某問答平臺上,關於“AIGC未來會扮演什麼樣的角色”的問題,只有一個回答,來自某投資機構,而該機構正是某AIGC沙龍的組織方,參與討論的創始人也主要描繪了一種核心的AIGC應用場景,那就是元宇宙。
而剛剛拿下千萬美金融資的某AI公司,正在佈局的AIGC領域也聚焦在虛擬人技術,為遊戲行業提供基於AI的智慧NPC、自動化QA、對話系統和AI陪玩。完成1億美元融資、由紅杉中國領投的某獨角獸,核心產品則是AI bot,表示希望作為虛擬世界的先鋒,圍繞元宇宙開展多維度的基建。
從這些脈絡中不難看出,AIGC技術本身很真實,但長期以來一直處於默默發展、偶爾出圈的狀態。能夠在近期快速成為一個風口、一種網紅概念,與元宇宙的爆火、資本的動向,不無關係。
在這個新故事中,一般會有如下邏輯:1.元宇宙需要很多數字人、需要個性化的數字環境;2.這些內容光靠人來開發週期太長,需要更高效的生產方式;3.AI的能力就是提質增效,適合用來創作;4.所以,AIGC有前途。
歸根結底就是,元宇宙要火了,AI能做。
AI能做是真,但元宇宙到底啥時候火,可就沒個準數了。
我們此前探討過,作為一個複雜龐大的技術叢集概念,元宇宙依賴很多技術的成熟,距離真正成型還很遙遠。在這一天到來之前,沒有人能清楚地定義什麼是元宇宙,自然也不可能量化出到底需要多少虛擬人、數字人。那麼,為了元宇宙而生的AIGC,到底價值幾何,可能就跟元宇宙一樣,是個見仁見智的玄學了。
既然AIGC的走紅是技術發展的產物,那麼它的上限,自然也要受到技術規律的約束。誠然,AI的發展給內容創作帶來了很多可能,但技術也決定了很多內容依然是AI無法做到的:
首先,AIGC的內容質量有待提升。
OpenAI用於編寫內容的通用GPT-3模型釋出之後,很多內容機構都基於它開發了相應的創作模型。目前來看,主要應用還是一些重複枯燥工作的自動化,以CCTV的AIGC平臺為例,主要是自動完成挖掘新聞熱點,將新聞報導資料進行深度關聯、輔助編輯選題策劃,基於模板快速生成海報圖片圖表,智慧生成內容標籤,修復歷史影片等等。
一些用於生成內容的AI編寫器,創作能力實在是不太行。要麼只能用於生成一些符合SEO(搜尋引擎最佳化)的營銷內容,比如YouTube影片標題、Facebook廣告標題、GoogleAds標題和描述、亞馬遜產品描述等等,主要是更通順地把關鍵詞堆疊在一起,你不會覺得某寶的寶貝標題就是一篇“大作”吧。
要麼是由機器學習黑匣子生成的部落格文章。對於這類文章,平臺們往往也會提醒,AI無法複製情感,沒有靈魂、同理心、經驗等細微差別。所以也會建議使用AIGC工具的創作者,僱用人類作家來校對這些工具建立的內容。
所以至少目前為止,AIGC能提供很多幫助,但還是無法取代人類創作者的。
這是我用一個海外AI一句話生成器寫出來的文章,可以說是前言不搭後語,大家給它打幾分呢?
其次,AIGC的互動能力還不夠自然。
雖說NLP技術有了極大的進步,人工智慧聊天機器人可以幫助企業與潛在客戶聊天、給轄區居民撥打電話、為電商平臺使用者提供售前售後諮詢服務……但想必大家依然還是能夠很明顯地區別出,對面到底是真人還是聊天機器人。反正我本人,如果需要完成一些複雜的交流和操作,都會一開始就輸入“人工客服”“找人工”等命令,而不是跟智慧客服在那裡“鬼打牆”。
目前,基於AI技術的人機互動還需要漫長的試錯、實踐、積累、迭代,更適用於一些重複率高、流程標準化、對專業度或靈活響應度沒那麼高的交流。比如在智慧音響裡跟主人閒聊,作為虛擬偶像滿足粉絲的基本情感互動需求,或是在電商場景裡作為主播“念稿子”直播帶貨。
這裡面其實已經有非常大的想象空間了,雖然距離“元宇宙”中那種“和真實的人一樣”的願景還有距離。
從應用前景來看,“含科量”滿滿的AIGC,開啟了內容創作的想象力,將會給包括虛擬人、數字人、圖文音影遊等各種應用創新帶來可能。
在廣闊的產業和個人消費市場,AIGC正等待著展翅高飛。而“含資量”不低的AIGC風口,當元宇宙的熱潮退卻後,又會有多少裸泳的人,就需要時間來告訴我們答案了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2856551/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 基於python的ftp(含資料庫、含多執行緒、含socketserver)PythonFTP資料庫執行緒Server
- CDN含義與DNS的聯絡DNS
- Generator 函式的含義與用法函式
- 【轉】Oracle 9i共提供了16種標量資料型別表:名稱 含義Oracle資料型別
- 黑客的含義黑客
- ITL的含義
- Promise的含義Promise
- 一張圖:9個資料科學中的距離測量與演算法資料科學演算法
- cache操作:clean、invalidate與flush的含義
- oracle隱含引數的檢視與修改Oracle
- 記憶體中,cache與buffer的含義記憶體
- 2020年-2023年全球金融科技投資交易量(含企業參與)(附原資料表)
- [STAThread]的含義thread
- restrict session的含義RESTSession
- 閉包的含義
- 根下的資料夾的含義(轉)
- bootstrap含義boot
- 【機器學習】--隱含馬爾科夫模型從初識到應用機器學習馬爾科夫模型
- SRE的含義及與 DevOps 如何關聯dev
- AIX 系統中 PVID 的含義與作用AI
- 特徵值與特徵向量的幾何含義(轉)特徵
- /proc/loadavg 各項資料的含義
- 機器學習實戰系列[一]:工業蒸汽量預測(最新版本上篇)含資料探索特徵工程等機器學習特徵工程
- 雲端計算的含義
- Java中static的含義Java
- oracle rowid 的含義Oracle
- Explain各列的含義AI
- CGContext含義GCContext
- 暖暖內含光
- 2021年Q1全球PC(含平板)電腦出貨量及增長率(附原資料表)
- 一文說清「VirtualDOM」的含義與實現
- ROWID的含義與塊地址rdba深入分析
- CBO,ORACLE,隱含引數,_sort_elimination_cost_ratio的含義Oracle
- 【論文學習】輕量級網路——MobileNetV3終於來了(含開原始碼)原始碼
- 讀資料質量管理:資料可靠性與資料質量問題解決之道01資料質量
- 大資料分析有什麼含義大資料
- 大資料含義之大多樣性大資料
- C++中&和*的含義C++