騰訊研究院：2023年AIGC發展趨勢報告（附下載）

報告下載：新增199IT微信公眾號【i199it】，回覆關鍵詞【2023年AIGC發展趨勢】即可下載

AIGC技術和產業生態

迎來發展快車道

AIGC的大爆發不僅有賴於AI技術的突破創新，還離不開產業生態快速發展的支撐。在技術創新方面，生成演算法、預訓練模型、多模態技術等AI技術匯聚發展，為AIGC的爆發提供了肥沃的技術土壤。

第一，基礎的生成演算法模型不斷突破創新。比如為人熟知的GAN、Transformer、擴散模型等，這些模型的效能、穩定性、生成內容質量等不斷提升。得益於生成演算法的進步，AIGC現在已經能夠生成文字、程式碼、影像、語音、影片、3D物體等各種型別的內容和資料。

第二，預訓練模型，也即基礎模型、大模型，引發了AIGC技術能力的質變。雖然過去各類生成模型層出不窮，但是使用門檻高、訓練成本高、內容生成簡單和質量偏低，遠遠不能滿足真實內容消費場景中的靈活多變、高精度、高質量等需求。而預訓練模型能夠適用於多工、多場景、多功能需求，能夠解決以上諸多痛點。預訓練模型技術也顯著提升了AIGC模型的通用化能力和工業化水平，同一個AIGC模型可以高質量地完成多種多樣的內容輸出任務，讓AIGC模型成為自動化內容生產的“工廠”和“流水線”。正因如此，谷歌、微軟、OpenAI等企業紛紛搶佔先機，推動人工智慧進入預訓練模型時代。

第三，多模態技術推動了AIGC的內容多樣性，進一步增強了AIGC模型的通用化能力。多模態技術使得語言文字、影像、音影片等多種型別資料可以互相轉化和生成。比如CLIP模型，它能夠將文字和影像進行關聯，如將文字“狗”和狗的影像進行關聯，並且關聯的特徵非常豐富。這為後續文生圖、文生影片類的AIGC應用的爆發奠定了基礎。

未來，演算法的進步將帶來更多激動人心的應用，語言模型會得到進一步發展，可以自我持續學習的多模態AI將日益成為主流，這些因素會進一步推動AIGC領域的蓬勃發展。

在產業生態方面，AIGC領域正在加速形成三層產業生態並持續創新發展，正走向模型即服務（MaaS）的未來。

目前，AIGC產業生態體系的雛形已現，呈現為上中下三層架構。

第一層是基礎層，以預訓練模型為基礎搭建的AIGC技術基礎設施層。在國外，以OpenAI、Stability.ai為代表，透過受控API、開源等方式輸出模型能力。

第二層是中間層，是在預訓練模型基礎上，透過專門的除錯和訓練，快速抽取形成垂直化、場景化、定製化的小模型和應用工具層，可以實現工業流水線式部署，同時兼具按需使用、高效經濟的優勢。比如，知名的二次元畫風生成模型Novel-AI，以及各種風格的角色生成器等，就是基於Stable Diffusion開源進行的二次開發。隨著AIGC模型加速成為新的技術平臺，模型即服務（Model-as-a-Service，MaaS）開始成為現實，預計將對商業領域產生巨大影響。

第三層是應用層，依託底層模型和中間層的垂直模型，各廠商進一步開放面向C端和B端使用者的各種各樣的AIGC產品和服務，滿足海量使用者的內容建立和消費需求。例如群聊機器人、文字生成軟體、頭像生成軟體等AIGC消費工具。

目前，從提供預訓練的AI大模型的基礎設施層公司到專注打造垂直領域內AIGC工具的中間層公司、再到直接面對消費者和終端使用者提供產品和服務的應用層公司，美國圍繞AIGC生長出繁榮的生態，技術創新引發的應用創新浪潮迭起；中國也有望憑藉領先的AIGC技術賦能千行百業。

AIGC在消費網際網路、產業網際網路

和社會價值領域持續產生變革性影響

AIGC領域目前呈現AIGC的內容型別不斷豐富、內容質量不斷提升、技術的通用性和工業化水平越來越強等趨勢，這使得AIGC在消費網際網路領域日趨主流化，湧現了寫作助手、AI繪畫、對話機器人、數字人等爆款級應用，支撐著傳媒、電商、娛樂、影視等領域的內容需求。目前AIGC也正在向產業網際網路、社會價值領域擴張應用。

在消費網際網路領域，AIGC牽引數字內容領域的全新變革。目前AIGC的爆發點主要是在內容消費領域，已經呈現百花齊放之勢。AIGC生成的內容種類越來越豐富，而且內容質量也在顯著提升，產業生態日益豐富。這其中有三個值得關注的趨勢：

第一，AIGC有望成為新型的內容生產基礎設施，塑造數字內容生產與互動新正規化，持續推進數字文化產業創新。過去AI在內容消費領域的作用主要體現在推薦演算法成為了新型的傳播基礎設施。推薦演算法對數字內容傳播，短影片為主的數字內容新業態發展，起到了顛覆式的變革作用。而現在，隨著AIGC生成的內容種類越來越豐富，內容的質量不斷提升，AIGC將作為新型的內容生產基礎設施對既有的內容生成模式產生變革影響。

第二，AIGC的商業化應用將快速成熟，市場規模會迅速壯大。當前AIGC已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大發展，市場潛力逐漸顯現。比如，在廣告領域，騰訊混元AI大模型能夠支援廣告智慧製作，即利用AIGC將廣告文案自動生成為廣告影片，大大降低了廣告影片製作成本。巨大的應用前景將帶來市場規模的快速增長，根據6pen預測，未來五年10%-30%的圖片內容由AI參與生成，有望創造超過600億以上市場規模。也有國外商業諮詢機構預測，2030年AIGC市場規模將達到1100億美元。

第三，AIGC還將作為生產力工具，不斷推動聊天機器人、數字人、元宇宙等領域發展。AIGC技術讓聊天機器人接近人類水平日益成為現實，當前以ChatGPT為代表的聊天機器人已經在刺激搜尋引擎產業的神經，未來人們獲取資訊是否會更多透過聊天機器人而非搜尋引擎？這已經使谷歌等公司面臨的巨大壓力。AIGC也在大大提升數字人的製作效能，並且使其更神似人。比如騰訊AI LAB的虛擬歌手AI艾靈，能夠基於AIGC實現作詞和歌曲演唱。在元宇宙領域，AIGC在構建沉浸式空間環境、提供個性化內容體驗、打造智慧使用者互動等方面發揮重要作用。比如，祖克伯在元宇宙的島嶼上，可以透過發出語音命令生成創造海灘、變換天氣，新增不同的場景等。只有藉助AGIC，元宇宙才可能以低成本、高效率的方式滿足海量使用者的不同內容需求。

在產業網際網路領域，基於AIGC技術的合成資料（synthetic data）迎來重大發展，合成資料將牽引人工智慧的未來。MIT科技評論將AI合成資料列為2022年10大突破性技術之一；Gartner也預測稱，到2030年合成資料將徹底取代真實資料，成為訓練AI的主要資料來源。

合成資料的用途是成為真實世界資料的廉價替代品，用來訓練、測試、驗證AI模型。AIGC技術的持續創新，讓合成資料迎來新的發展契機，開始迸發出更大的產業發展和商業應用活力。這主要體現在以下四個方面：

第一，合成資料為AI模型訓練開發提供強大助推器，推動實現AI 2.0。過去用真實世界資料訓練AI模型，存在資料採集和標註的成本高昂，資料質量較難保障、資料多樣化不足、隱私保護挑戰等多方面問題。而合成資料可以很好的解決這些問題。使用合成資料不僅能更高效地訓練AI模型，而且可以讓AI在合成資料構建的虛擬模擬世界中自我學習、進化，極大擴充套件AI的應用可能性。從某種意義上也可以說合成資料讓AI模型訓練從1.0階段發展到2.0階段。

第二，合成資料助力破解AI“深水區”的資料難題，持續擴充產業網際網路應用空間。目前，合成資料正迅速向交通、金融、醫療、零售、工業等諸多產業領域擴充應用，幫助破解產業網際網路應用中的資料難題。比如，騰訊自動駕駛團隊研發的模擬系統TAD SIM可以自動生成各種交通場景資料，助力自動駕駛系統測試、開發。在醫療領域，美國國立衛生研究院和合成資料服務商合作，基於其COVID-19病人病歷資料庫，合成了不具有可識別性的替代資料，可供世界範圍內的研究人員自由分享和使用。

第三，正是由於合成資料對人工智慧未來發展的巨大價值，合成資料正加速成為一個新產業賽道，科技大廠和創新企業紛紛搶先佈局。目前，全球合成資料創業企業也已經達到100家，英偉達、亞馬遜、微軟等頭部科技企業也在加速佈局，湧現了合成資料即服務（SDaaS，synthetic data as a service）這一全新商業模式。

第四，合成資料加速構建AI賦能、數實融合的大型虛擬世界。合成資料指向的終極應用形態是藉助遊戲引擎、3D圖形、AIGC技術構建的數實融合的大型虛擬世界。基於合成資料構建的大型虛擬世界，為測試、開發新的人工智慧應用，提供了一個安全、可靠、高效以及最重要的是——低成本的、可重複利用的環境，將成為AI數實融合的關鍵載體，包括為AI開發提供資料和場景、試驗田等。比如騰訊開悟的AI開放研究環境，已經吸引了國內外眾多決策智慧領域的研究團隊使用。

在社會價值領域，AIGC也在助力可持續社會價值的實現。比如，在醫療健康方面，AI語音生成幫助病人“開口說話”。語音合成軟體製造商Lyrebird為漸凍症患者設計的語音合成系統實現“聲音克隆”，幫助患者重新獲得“自己的聲音”。AI數字人也能幫助老年痴呆症患者與他們可能記得的年輕面孔或者逝去的親人互動。此外，AIGC也可以用於文物修復，助力文物保護傳承。騰訊公司利用360度沉浸式展示技術、智慧音影片技術、人工智慧等技術手段，對敦煌古壁畫進行數字化分析與修復。在國外，DeepMind合作開發的深度神經網路模型Ithaca可以修復殘缺的歷史碑文。

總之，隨著AIGC模型的通用化水平和工業化能力的持續提升，AIGC的根本影響在於，將極大降低內容生產和互動的門檻和成本，有望帶來一場自動化內容生產與互動變革，引起社會的成本結構的重大改變，進而在各行各業引發巨震。未來，“AIGC+”將持續大放異彩，深度賦能各行各業高質量發展。

以可信AIGC

積極應對科技治理問題與挑戰，擁抱人工智慧的下一個時代

發展總是與挑戰並生，AIGC的發展也面臨許多科技治理問題的挑戰。目前，主要是智慧財產權、安全、倫理和環境四個方面的挑戰。

首先，AIGC引發的新型版權侵權風險，已經成為整個行業發展所面臨的緊迫問題。因版權爭議，國外藝術作品平臺ArtStation上的畫師們掀起了抵制AIGC生成影像的活動。其次，安全問題始終存在於科技發展應用之中。在AIGC中，主要表現為資訊內容安全、AIGC濫用引發詐騙等新型違法犯罪行為，以及AIGC的內生安全等。較為著名的案例是，詐騙團隊利用AIGC換臉偽造埃隆·馬斯克的影片，半年詐騙價值超過2億人民幣的數字貨幣。再次，演算法歧視等倫理問題依然存在。比如，DALL·E 2具有顯著的種族和性別刻板印象。最後是環境影響，AIGC模型訓練消耗大量算力，碳排放量驚人。此前就有研究表明，單一機器學習模型訓練所產生的碳排放，相當於普通汽車壽命期內碳排放量的5倍。

能夠自動檢測精準識別影片、影像中是否應用人臉偽造技術

為了應對以上挑戰，面向人工智慧的下一個時代，人們需要更加負責任地、以人為本地發展應用AIGC技術，打造可信AIGC生態。面對AIGC技術應用可能帶來的風險挑戰，社會各界需要協同參與、共同應對，透過法律、倫理、技術等方面的多元措施支援構建可信AI生態。在立法方面，網信辦等三部門出臺的《網際網路資訊服務深度合成管理規定》針對深度合成技術服務提出的要求和管理措施，諸如禁止性要求、標識要求、安全評估等，亦適用於AIGC。接下來，需要著重從以下方面持續推進AIGC的政策和治理。

其一，政府部門需要結合AIGC技術的發展應用情況，制定並明晰AIGC的智慧財產權與資料權益保護規則。目前，AIGC的智慧財產權與資料權益保護規則的不明確，在某種程度上導致甚至加劇了AI領域的亂象。

其二，研發應用AIGC技術的主體需要積極探索自律管理措施，例如，秉持不作惡、科技向善等目的，制定適宜的政策（消極要求和積極要求），採取控制和安全措施保障AIGC的安全可控應用，採取內容識別、內容溯源等技術確保AIGC的可靠來源。

其三，打造安全可信的AIGC應用，需要深入推進AI倫理治理。例如，行業組織可以制定可信AIGC的倫理指南，更好地支援AIGC健康可持續發展；AIGC領域的創新主體需要考慮透過倫理委員會等方式，推進落實AI風險管理、倫理審查評估等，在AIGC應用中實現“倫理嵌入設計”（ethics by design）。

其四，社會各界需要攜手應對AIGC領域的能源消耗問題，推行綠色AI的發展理念，致力於打造綠色可持續、環境友好型的AI模型，實現智慧化與低碳化融合發展。

未來已來，讓我們擁抱AIGC，擁抱人工智慧的下一個時代，打造更美好的未來。