今年,中國AI大模型產業發展看這些

机器之心發表於2024-03-28

現在的人工智慧,已不是「可以用」,而是「非常好用」了。

上個星期,谷歌與李世石一次久違的對話,喚起了人們的回憶:

今年,中國AI大模型產業發展看這些

仔細想來,自 2016 年 AlphaGo 在圍棋上打敗人類起已過去八年。如今人工智慧技術的發展卻絲毫沒有減速,正在給我們創造更大的震撼。

生成式 AI 技術從引領技術爆發的 GPT-4 開始,已經席捲了各個領域。不論是自動寫文章,還是生成圖片和影片,大模型等技術正隨著 Copilot、AI 手機等產品逐步落地。在可見的未來,向我們招手的還有具身智慧 —— 透過軟硬體結合,機器人正在變得更聰明,即將代替我們的部分勞動。

圖片

最近,「新質生產力」理論正成為科技領域的熱門話題。新質生產力是以新產業為主導的生產力,它相對傳統生產力呈現出顛覆性創新驅動,具有產業鏈條新、發展質量高等特徵,對新舊動能轉換髮揮著引領性作用。

而 AI 大模型技術的突破,正是驅動科技創新,構建未來產業的強大動力。人工智慧帶來的科技革命可能會像工業革命、資訊革命一樣,給每個人的生活帶來巨大的改變。

3 月 26 日,博鰲亞洲論壇上,人民網正式釋出了《2024 年中國 AI 大模型產業發展報告》,闡述了中國 AI 大模型的發展現狀和典型案例,深入探討國內 AI 大模型產業發展所面臨的挑戰,同時也對未來趨勢進行了展望。

圖片

報告下載連結:http://download.people.com.cn/jiankang/nineteen17114578641.pdf

其中有關「下半場」競爭態勢、端側應用爆發等判斷,尤為值得關注。

AI 大模型技術落地,將是大浪淘沙

人工智慧在持續發展的過程中,已在很多地方實現了落地,包括但不限於語音識別人臉識別機器翻譯目標檢測影像生成、輔助駕駛等等方面。很大程度上,新技術已經在幫助千行百業提高生產力了。

隨著生成式 AI 技術的發展,智慧化升級的範圍還將擴大,程度還會更高。作為擁有 AI 完整產業體系的國家,新一代 AI 方案正在中國深入各行各業。

不過,要實現真正的技術變革,我們還面臨著一系列挑戰。

第一個挑戰是算力短缺。隨著大模型規模呈現指數級增長,演算法越來越依賴高效能 AI 晶片。有市場研究公司報告稱,去年僅 Meta 和微軟兩家公司就從英偉達處分別購買了 15 萬塊 H100 GPU,各花去約 45 億美元,但這還遠遠不夠:基於 H100 的伺服器的交付週期已經長達 52 周。

在國內,高效能 AI 晶片市場還因為進出口限制和技術瓶頸的雙重影響,大模型產業發展正在受到算力層面的制約。

第二個挑戰是大模型架構的侷限性。如今的 AI 預訓練大模型均採用自注意力機制的 Transformer 神經網路結構,它在自然語言處理等領域具有諸多優勢,包括可實現完全平行計算、捕捉長距離依賴關係、模組化設計、處理不定長序列、結構擴充套件以及預訓練效果好等等。

但隨著人們的不斷開發與擴充套件,transformer 固有的算力消耗資源大、記憶體佔用多、泛化能力有侷限性等問題也逐漸顯現。

就連 Transformer 論文《Attention Is All You Need》的七位原作者在最近 GTC 大會的圓桌討論上也表示,這個世界需要比 Transformer 更好的東西,才能將我們帶到新的效能高原。

圖片

對資料的運用,是制約大模型落地的另一個重要因素。對於從頭開始訓練的大模型,語料資料的質量很大程度上會影響模型能力。大模型對資料供給的要求極高,比如 OpenAI 在訓練 GPT-4 時,就在大約 13T token 的資料上進行了訓練,其中包括基於文字和基於程式碼的資料,以及來自 ScaleAI 和內部的一些微調資料。

相對而言,國內的 AI 大模型資料面臨著資料型別不全面、資訊可信度不高等問題。整體來看,可用於大模型訓練的中文資料庫相比英文資料,體量嚴重不足。

最後,我們還在期待更多爆款應用。ChatGPT 自發布以來迅速成為史上增速最快消費級應用,提供支援的微軟也將大模型技術引入到了 Office、Teams 甚至 Windows 作業系統中。而在國內科技公司的生態中,至今仍沒有出現類似的爆款級應用,原因可能在於尚未找到商業化思路,技術、個性化程度仍未滿足使用者需求。

可以說,在生成式 AI「百模大戰」後,演算法創新最佳化、生態構建和應用落地等任務,為正在構建 AI 技術體系的公司提出了更高的要求。只有少數脫穎而出者,才會進入未來的大規模應用階段。

新方向已出現:走向端側,端雲結合

毫無疑問,在 AI 新技術上,國內科技公司一直在堅持投入,已經收穫了不小的成果。

透過大規模資料訓練,數百億甚至千億引數量級的通用大模型能夠學習捕捉複雜規律和特徵,對前所未見的資料做出預測。通用大模型能理解學習多種任務,得益於大規模預訓練和微調正規化,可完成多領域任務,並具備多模態的理解和生成能力。

以百度文心一言、阿里通義千問、科大訊飛星火、騰訊混元大模型等為代表,一批高引數體量的雲端大語言模型充分利用了算力和海量訓練資料,已經能提供語言理解、知識問答、數學推理、程式碼生成等能力。

它們一邊面向 C 端個人使用者提供智慧問答、文字摘要與生成、圖片生成、影片生成等功能。另一方面面向 B 端企業使用者,正在改變企業的傳統業務模式,正在提供智慧化營銷、客服、自動會議記錄、文字翻譯、預算管理等前所未有的能力。

基於通用大模型基礎,我們看到了面向特定行業和領域的專用大模型,已開始進入金融、政務、醫療等領域。

而在端側方向上,接連出現了 AI 手機和 AI PC 兩個新概念,大模型展現了廣泛的應用前景。

基於端側深度最佳化的「小體量」預訓練模型能力,個人裝置的使用方式和習慣正在被重塑。AI 已經能提供文件搜尋、智慧識屏、影像創作、生活助手、出行助手等個性化服務。隨著大模型的極致最佳化,人們甚至在展望智慧穿戴裝置上的大模型應用。

圖片

端側大模型一方面可以為人們帶來更加個性化的 AI 能力,對使用者意圖進行更深度、精準、細膩的理解,提供更加個性化的複雜場景服務。同時也能夠保證資料位於端側,保護了人們的隱私資訊。

另一方面,一部分雲端計算任務轉移給終端處理,還會大幅降低算力成本;一些複雜的工作和在端側處理後的內容,也可以透過網路交由雲端千億級,甚至萬億級的 AI 大模型來進行處理,這就是「端雲協同的 AI」。

端雲協同進化的大模型體系有望解決當前大模型正規化面臨的一些問題與挑戰:

  • 在計算資源方面,端雲協同能夠充分利用雲端、終端的碎片化計算資源,並與通訊以及儲存資源進行聯合最佳化;

  • 在模型架構方面,端雲大小體量不同的模型以及聚合的新模式,同時獲得了大模型的湧現能力與小模型的功耗優勢;

  • 在資料方面,快速發展的大、小模型和各類應用正在催生規範化、行業細分的資料治理體系;

  • 在應用方面,端側大模型在理解使用者意圖後,可以高效呼叫其他大模型、服務和硬體能力,實現極高的可用性。

這或許會是新一輪人工智慧的變革方向所在。

AI 手機落地引領趨勢

正是因為端側 AI 大模型和「端雲協同」的前景,率先把大模型落地到消費級領域的,是各大手機廠商。

去年末到今年初,國內眾多廠商陸續推出了新一代旗艦手機,生成式 AI 能力不約而同地成為了釋出的重點。

這些手機廠商提出的「AI 手機」有的發力意圖理解,透過端側 AI 技術,以人為中心,利用個性化資訊、感測器能力大幅提升手機的情境感知水平,帶來各種高效的智慧服務。

有的透過平臺化 AI,以端側 + 雲側模型連線各類服務,實現了高效的推理決策。而利用大模型「智慧體」將複雜任務分解,並在每個子步驟實現自主決策,手機不僅對人發出的指令和需求實現了深度理解,還可以進一步簡化操作,自主實現多種複雜目標。

在這其中,vivo 在大模型端側化、矩陣化的表現尤為突出,在新發布的報告中作為企業案例獲得了詳細介紹。

去年 11 月,vivo 正式釋出了自研 AI 大模型「藍心 BlueLM」,並搭載於新一代旗艦手機 vivo X100 系列上率先落地。

這是行業內首個在手機端執行的開源自研大模型,其覆蓋十億、百億、千億三個引數量級,共計五款模型。基於藍心大模型能力,vivo 在端側提供了藍心小 V 和藍心千詢兩款應用,併為手機提供了全域性智慧輔助功能。

圖片

vivo 的技術創新,已經讓很多人享受到大模型帶來的便利。官方給到我們一組數字:藍心大模型目前已經覆蓋了超過 2000 萬使用者,實現了 2761 萬次高質量問答、生成了 1757 萬張畫,寫了 649 萬份報告,「AI 修圖」功能還消除了 85 萬個路人。

在這背後既有端側大模型能力和最佳化帶來的優勢,還有 vivo 大模型矩陣化的功勞:不同引數量級的大模型可以透過多種部署方式應用於不同場景,在滿足使用者手機端側體驗的同時,最佳化了推理效能以及端側部署時佔用的記憶體和功耗。

其中,藍心大模型的 1B 和 7B 版本可在手機端執行,既實現了面向端側硬體能力的最佳化,又提供了良好的 AI 生成能力,使得一些應用可以全天候正常執行。

70B 版本的藍心大模型則是面向雲端服務的主力模型,提供角色扮演、知識問答等能力,既有智慧湧現,也能兼顧成本和效能。面向複雜任務,vivo 也透過 1300 億和 1750 億兩款大模型,依靠更豐富的知識量,帶來了更加專業的智慧體驗。

圖片

隨著引數量的提升,藍心大模型逐漸具備了文字總結、語言理解、文字創作、知識問答、角色扮演、複雜邏輯推理、複雜任務編排等能力。結合新一代手機的 AI 算力,藍心大模型實現了端側部署與端雲結合的能力。

博鰲亞洲論壇期間,vivo 介紹了藍心大模型的最新落地進展:目前手機使用者們獲得的 AI 能力已升級到「端側 7B」+「雲側 70B」的組合,充分利用到了端雲結合的優勢。

圖片

vivo 在人工智慧技術的四大維度 —— 資料、人力、演算法、算力上都做到了領先:自 2017 年起,vivo 組建了人工智慧研究團隊,並建設知識圖譜積累資料,多年來已在頂級期刊發表了一系列高水平論文。vivo 的研究成果正在不斷轉化為工程應用,目前其自研大模型已位居大語言模型綜合性考試評測集 C-Eval 中文榜單前列。

圖片

C-Eval 排行榜:https://cevalbenchmark.com/static/leaderboard_zh.html

透過對手機生態和使用者使用特徵的深度思考,端側智慧助理透過大模型的加持獲得了前所未有的能力,已不僅僅是「能夠與人自然對話」,而是在大量使用者學習、生活、工作等場景上都帶來了顛覆性的體驗。

2024 年,AI 大模型應用落地爆發?

AI 手機還有很大的發展空間。隨著 AI 演算法迭代最佳化、晶片效能提升和應用場景擴充,新生產力將日益普及,滿足人們不斷增長的多元化需求。

AI 大模型將深刻影響人們與裝置互動的方式,今年或許就將發生質變。

在博鰲論壇上人們表示,2024 年隨著從政府到開發者各個層面的支援、使用者需求的激增,再加上科技公司投入力度的推動,大模型將進入快速發展的階段。如果具體到手機上,結合 AI 大模型端側化、矩陣化的技術演進,大模型技術的落地將顛覆一系列我們眼中一成不變的功能。

我們可以期待未來手中的裝置,能夠呈現出完全不同的形態。

相關文章