大模型落地持續加速中。
9月5日,騰訊宣佈推出新一代大模型“混元Turbo”,相比前代模型,騰訊混元Turbo效能顯著提升,訓練效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多個基準測試上對標GPT-4o,且第三方測評居國內第一。
目前,混元Turbo已經在騰訊雲上線,輸入和輸出價格只有前代模型的一半。企業和開發者可以透過API、專屬模型、精調模型等方式使用混元大模型相關能力。
騰訊集團高階執行副總裁、雲與智慧產業事業群CEO湯道生表示,隨著大模型與生成式AI的技術突破,圖片、影片、語言的理解與生成已經有很大進步,人與人的溝通、人與系統的互動方式,都可能會被重塑。最近半年,產業界對AI大模型的關注重點,開始從模型技術本身,轉到智慧應用落地上。用人工智慧在已有業務場景中降本增效,提高經營效率,是行穩致遠的可靠路徑。
騰訊集團高階執行副總裁、雲與智慧產業事業群CEO湯道生
據介紹,騰訊已經構建起了全鏈路的大模型產品矩陣,包括底層基礎設施、幫助企業訓練專屬模型的TI平臺和行業大模型解決方案,自研的混元大模型,構建應用的平臺工具,以及基於大模型的各類智慧應用。
會上,騰訊AI應用“元寶”宣佈品牌智慧體專區正式上線,企業在騰訊元器上製作的智慧體可以一鍵釋出到品牌智慧體專區。品牌智慧體專區首批邀請 11 家合作伙伴入駐,打造精品AI智慧體應用生態,涵蓋工作提效和生活娛樂多個場景,使用者可以直接在“騰訊元寶”APP上體驗豐富的品牌智慧體應用。
“面向場景創造價值才是大模型發展的意義。”騰訊雲副總裁、騰訊雲智慧負責人、優圖實驗室負責人吳運聲表示,大模型已經在全球發展了兩年,一方面,模型效能不斷提升,圍繞著模型的產品使用門檻變得更低、更加易用;另一方面,企業積極探索大模型與自身業務場景的結合,大模型的落地場景變得更豐富、更縱深。
騰訊雲副總裁、騰訊雲智慧負責人、優圖實驗室負責人吳運聲
吳運聲介紹,基於全矩陣的大模型產品,騰訊已經服務了眾多客戶,在知識管理、智慧客服、研發提效、智慧營銷、內容生成、辦公協同、風險管控等場景中,幫助企業實現了降本增效和業務創新。
大模型工具持續升級,更便捷、更易用
為了讓企業更快更便捷地開發AI原生應用,騰訊雲在今年5月推出了三款PaaS產品知識引擎、影像創作引擎和影片創作引擎,加速應用落地。
透過大模型知識引擎,企業用自然語言和簡單配置,5分鐘就可以開發出一款大語言模型應用,服務於客服營銷、企業知識社群等業務場景。經過幾個月的產品迭代,知識引擎產品在使用者需求識別與理解、企業知識處理、檢索和理解能力上,都有很大升級。同時,知識引擎支援元件能力單獨輸出,企業可以按需購買文件解析、文件拆分、向量化等能力,按需部署到自身的應用中去。
在影像創作引擎層面,基於混元生圖能力的升級,影像風格化、AI寫真、商品背景生成、模特換裝等功能也進一步實現了迭代。在AI寫真層面,影像創作引擎實現了免訓練技術突破,輸入一張照片後可直接跳過訓練環節等待,一鍵生成高畫質寫真藝術照,整體出圖耗時縮短75%。
針對很多電商商家高頻使用的商品背景生成能力,影像創作引擎可實現商品在不同場景中高度逼真的虛擬效果展示。在模特換裝場景下,採用3D先驗方案,提升重建人像效果,在高度保持模特臉部、手部細節的同時,精確將服裝版型細節與模特身體特徵對齊,確保換裝後的效果逼真自然。
基於混元的DiT架構模型,影片創作引擎也迎來了全新的升級。新增了圖片跳舞、圖片唱演和影片轉譯等能力,已經實現了單段舞蹈的生成時間從10分鐘下降至1分鐘級別,同時支援轉身、側身等難例舞蹈動作。同時,針對很多客戶有需求的影片轉譯能力,影片引擎接入了混元文生文大模型和 TTS 技術,讓轉譯後的影片能夠保留說話人的音色特徵,同時實現說話人口型與目標語種一致的視聽效果。目前影片轉譯功能支援超過15種小語種,覆蓋主流外語翻譯,可應用於影片本地化、跨境電商等場景。
為了幫助企業使用者更便捷地打造專屬模型,人工智慧開發平臺TI平臺也進行了全新升級。
TI平臺致力於構建面向實戰的大模型精調工具鏈,幫助使用者訓練出真正可用的大模型,並縮短模型開發週期,提升研發效率與資源利用率。
高質量的訓練資料是精調出一個可落地大模型的前提條件。TI 平臺的多模態資料集管理和資料標註能力,可提升大模型精調的資料準備效率和訓練資料質量,從而提升大模型訓練效率和最終效果。
在精調資料準備層面,TI平臺全新支援面向多模態大模型的資料集管理和資料標註,首創了基於Schema的標註方法,支援使用者自動生成個性化標註工作臺,支援文生文、圖生文、圖文改寫、圖文混合問答等主流場景下的全部細分任務型別。
落地加速,場景創新更豐富、更縱深
大模型要貼近場景創造價值已經是業界的共識。騰訊目前已經有700多款產品接入混元大模型,實現使用者體驗的提升。騰訊全矩陣的大模型產品目前已經在知識管理、智慧客服、研發提效、智慧營銷、內容生成、辦公協同、風險管控等落地。
在智慧客服與知識管理場景中,基於大模型的生成能力,可以顯著提升複雜問題的解決效率,提升回答質量。長安汽車與騰訊利用大模型知識引擎,整合汽車使用手冊等資料,有效解決了客戶在車輛使用和維護中的疑問,顯著提升了客戶服務體驗。
在智慧營銷場景,大模型可以提升廣告素材的生產效率,增強營銷活動的趣味性和互動性。比如蒙牛集團利用圖生圖技術,將使用者上傳的全家福轉化生成為特製的卡通畫風,助力會員拉新、提升使用者活躍。
在內容創意場景,大模型可以讓內容生產的週期大幅縮短,提供更多的創意玩法。比如,人民日報、新華社等媒體結合混元的文生影片能力進行影片創作。過去,影片內容需要一幀幀進行設計和製作,製作週期短則數天,長則數月。現在藉助影片生成能力,只需一段文字或者幾張圖片,就能在幾分鐘內生成優質影片內容。
在研發提效領域,騰訊利用TI平臺等工具,幫助易車、閱文等企業搭建自己的大模型,顯著降低了模型構建的時間和成本;另一方面,透過騰訊雲AI程式碼助手等工具,輔助開發者提升研發的效率,幫助企業提升整體研發效能。
在辦公協同場景中,騰訊旗下的企業微信、騰訊會議、騰訊文件都已經接入了混元大模型。在大模型的助力下,企業微信可對英文郵件進行智慧檢查,輔助英文郵件糾錯,騰訊會議可以自動總結會議紀要,騰訊文件能夠自動生成各類文件。
在風險管控領域,風控大模型可以解決傳統風控中建模時間長、效率低的難題。透過打包豐富的反欺詐知識,實現“小樣本”訓練遷移,快速構建契合業務需求的風控模型體系。比如,東風日產汽車金融,基於少量提示樣本遷移,就完成了適配自身業務場景的風控模型定製。相比於傳統的建模方式,模型KS效能提升超過20%,在跨場景的泛化性測試上效能提升53%。