國產大模型群雄逐“滬”,訊飛星火如何閃耀WAIC?

新闻助手發表於2024-07-04

7月4日,2024世界人工智慧大會暨人工智慧全球治理高階別會議(簡稱“WAIC 2024”)在上海世博中心開幕,WAIC 2024作為全球最高規格的AI產業盛會,今年共有500多家企業參展,匯聚了超1500件展品,大模型成為本屆大會的“重頭戲”,國內主流大模型齊聚上海灘,既包括科大訊飛星火、百度文心一言、阿里通義、騰訊元寶、華為盤古等市場熱門產品,又囊括百川智慧、智譜AI、Minimax、階躍星辰等新銳實力。

從今年WAIC 2024展會可以看出,大模型產業逐步由虛向實、錨定場景、深耕行業,不斷髮揮賦能價值。本次是訊飛星火V4.0、訊飛曉醫、星火企業智慧體平臺正式釋出後的首秀,不但展示了訊飛星火V4.0在學習、生活、工作等多場景下的最新應用成果,還面向行業場景與企業客戶提供了豐富的解決方案。國產大模型群雄逐“滬”,訊飛星火如何閃耀WAIC?

國產算力自主可控 星火V4.0拿下“中國唯一”

去年,AIGC(生成式大模型)開啟了人工智慧嶄新的時代,“生成”實際上是前端呈現給使用者的結果,其後端還需要經過複雜的訓練和運算。因此在大模型的底層,算力扮演著重要角色。大模型資料訓練的時長或者創新的快慢,根本上取決於算力的大小以及穩定、持續地供應。但隨著中美科技博弈的加劇,如何保障大模型算力的持續供給,防止技術封鎖與“卡脖子”的發生?

正如科大訊飛董事長劉慶峰所言,國產底座能力決定了企業在這條路上到底能走多遠,要以長期主義來打造我們真正自主可控的AI產業生態。據訊飛星火V4.0釋出會介紹,訊飛星火是中國第一個基於國產算力訓練出來的全民開放的大模型。在國產化的底座下,能為行業帶來更高的話語權與安全性。

無論是從技術迭代還是資料安全等維度,建立自主可控的國產算力底座無疑才是“最優解”,科大訊飛肩負“AI國家隊”的責任與使命,致力打造自主可控的AI產業生態。這次星火大模型V4.0最醒目的優勢,就是基於全國首個國產萬卡算力叢集“飛星一號”訓練,不僅算力與演算法自主可控,而且程式碼完全自己編寫,資料完全自己清洗,成為中國唯一全自主可控的大模型。

對標GPT-4 Turbo ,國產大模型打造“更懂你的AI助手”

作為人工智慧國家隊,科大訊飛一直積極投身於通用人工智慧技術浪潮,自去年五月正式釋出訊飛星火大模型,持續對標國際最先進水平,以自主創新推動每一次技術躍遷。

訊飛星火V3.0已實現了對ChatGPT的整體超越,醫療領域更是超越GPT-4。而在更早的星火V2.0那一版本,知名科技媒體《麻省理工科技評論》就對中國四款主流大模型進行橫評,結果訊飛星火力壓群雄,被評為“最聰明”的中國大模型。

就在WAIC前夕,6月27日,全新升級的訊飛星火V4.0如約而至,科大訊飛交出訊飛星火下半年的“成績單”:8個國際權威測試集測評第一,整體超越GPT-4 Turbo。在釋出會上,科大訊飛根據《通用認知智慧大模型評測體系》構建測試集,結果顯示訊飛星火V4.0在文字生成、語言理解、知識問答、邏輯推理、數學能力等維度全面超越GPT-4 Turbo,程式碼與多模態能力也大幅提升。而在國際組織的12項測試集對比中,訊飛星火V4.0也實現了8項超越,其中理解與推理能力在四大機構測試中取得“全勝”戰績,該能力也是大模型最基礎、卻又最核心的能力,可以幫助AI思考、分析、理解和掌握事物的本質和運作規律,訊飛星火實力捍衛“國產最強大模型”站位。

全新升級後的訊飛星火V4.0“智商”再進化,在上個月結束的中高考實測中,訊飛星火語數外各科“成績”均排名第一,被業界評為“更會做題的大模型”。全國中小學生作文競賽評委呂政嘉和河南省基礎教育教學專家庫成員李來明共同選取了新課標I卷高考作文、新課標II卷作文、北京高考(1)和(2)卷作文這四張試題“刁難”7款大模型,結果訊飛星火作出的《問,豈可少?》得到51.5的最高分,不僅思路清晰,而且鞭辟入裡,發人深省。而在新京報對星火V4.0與GPT-4o進行的中考作文實測中,星火V4.0以36.5平均分力壓GPT-4o。

除了在底座能力上對標國際領先水平,具體到大模型的落地打法和實用性,訊飛星火還走出了一條自己獨特的發展路線,讓大模型從“通用AI助手”躍遷到“懂你的AI助手”,開啟大模型“私人定製”時代,讓大模型更好用、更實用、更具“個性化”。訊飛星火V4.0版本全新發布“個人空間”功能,使用者可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再結合人設,讓大模型生成更個性化內容。此外,訊飛星火首批上線 14 個智慧體,面向特定場景打造專屬助手。

同時訊飛星火作為業界首個支援長影片、長文字、長語音的大模型,訊飛星火V4.0版本的長文字能力也全新升級,並針對長文件知識問答的幻覺問題,業界首發了溯源功能,大大提升大模型工作、學習“可用性”。

軟硬一體化落地 解決大模型應用的“最後一公里”

一款大模型的產業價值,不僅要看算力與演算法等資料引數,更要看如何與垂直行業進行結合,以及產品在剛需場景下如何落地。同時大模型與行業結合時二次開發、對接成本儘可能要小,否則就是中看不中用的“繡花枕頭”。科大訊飛採取的策略是,用更小的算力、更高的效率,來打造企業專屬大模型。並透過軟硬一體化協同,讓大模型由虛向實,從落地深耕邁向落地“生根”。

具體來看,科大訊飛基於雲邊端一體化和軟硬體一體化,在智慧家電、智慧汽車、運營商、機器人等行業場景實現全面賦能。比如科大訊飛與奇瑞聯合打造的星紀元ET智慧座艙,就透過星火大模型作為智慧中臺,打通了心率感測器等內外部裝置,可以對司機進行心率監測提醒,確保長途行車安全。還有業界首發的星火智慧批閱機,看似印表機的外表,卻擁有自動批改試卷的“魔力”,讓老師減負增效,將更多精力投入到學生的五育教育上。

面向更多行業場景,訊飛還以企業智慧體的方式,面向特定行業、特定場景打造專屬AI助手,訊飛星火V4.0釋出會現場正式釋出星火企業智慧體平臺。據瞭解,圍繞搭建智慧體的三大關鍵能力,當前星火企業智慧體平臺已覆蓋400+AI原子能力,整合90+外部信源,打通100+內部IT系統,可供企業結合業務場景快速構建可落地的智慧體應用。平臺還圍繞生產域、科創域、辦公域、管理域上線32個企業智慧體,供企業即插即用。星火企業智慧體平臺打通了場景價值落地的最後一公里,也幫助企業打通了大模型應用的最後一公里。

正是憑藉真正的實用與好用,使得星火深受企業歡迎。根據數智前線披露的2024上半年大模型招投標情況,科大訊飛成為了外部訂單數量最多的“標王”,央國企為代表的行業客戶成為星火最大客群。在訊飛星火構建的大模型算力底座下,企業可以根據自身業務需求去匹配不同的算力,用最小的算力實現更高的效率,也就是“殺雞焉用宰牛刀”的邏輯,最終實現效率最大化與效益最最佳化。

再回到本屆WAIC,今年大模型參展數量多達百款,多家廠商帶來了產品和技術“首秀”,再次讓“百模大戰”得以具象化,在現場你會感受到大模型賽道的蓬勃生機,同時也暗藏優勝劣汰的殘酷競爭。

對於國內的大模型廠商來說,理性看待差距,堅持長期主義精神,是決勝關鍵。在國際人工智慧拉力賽中,國產大模型在迎頭追趕的同時,對方也在快速迭代,只有正視差距,才有機會趕超。在訊飛星火V4.0釋出會上,科大訊飛董事長劉慶峰說道:“我們既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到產業生態、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI產業生態。”

劉慶峰坦言,訊飛星火V4.0已經實現了GPT-4 Turbo的對標,在文字生成、語言理解、知識問答、邏輯推理、數學這些能力上都已經實現超越,但在程式碼和多模態能力上還有差距。程式碼是連線虛擬世界和物理世界的橋樑,這個能力是中國大模型一定要搶佔的核心能力。在訊飛星火V4.0釋出會上,科大訊飛也介紹了程式碼領域的最新進展:持續迭代的程式碼智慧體iFlyCode整合了程式碼生成助手、架構設計助手、程式碼問答助手、測試助手、資料庫最佳化助手、程式碼稽核助手等六大場景智慧體,將採納率由30%提升至52%,大幅度提升企業智慧體的實用性。據瞭解,程式碼智慧體已在銀行、家電等行業在內的100多家企業以“AI程式設計師”的身份上崗。以交通銀行為例,基於星火大模型能力的產品iFlyCode覆蓋6000+研發人員,程式碼採納率達38%,工作效率顯著提升。

劉慶峰表示,程式碼能力是科大訊飛非常關注的能力之一,因為它涉及未來的產業資訊化和資訊產業化的核心,而ChatGPT去年2月份透過谷歌二級程式設計師測試,當時的GPT-3.5用這個測試集只獲得了60多分,GPT-4 Turbo今年1月份測試大概在80分,現在到86分,也在快速迭代和進步。科大訊飛預計在今年8月份,訊飛星火將達到86分以上的水平。

隨著訊飛星火V4.0重磅釋出以及在WAIC上的升級後“首秀”,可以窺見訊飛星火作為國產大模型代表,已在技術底座、商業化落地等方面彰顯出引領性。未來,在以商業落地為重頭戲的後半場,隨著AI助手的持續打造以及一系列的落地動作,無疑都會助其再次佔領行業競爭的先機。

相關文章