春節期間,DeepSeek 一躍成為全球矚目的焦點。它以僅約十分之一的超低訓練成本,成功推出了效能與OpenAI o1近乎相當的開源模型,對全球科技領域帶來巨大沖擊,先後引發美國科技股的大幅下跌,以及矽谷科技巨頭和各國政要的紛紛回應,如今全球各大晶片廠商和智算雲服務廠商更是積極響應、跟進適配。半個月來,DeepSeek相關話題熱度居高不下,熱搜頻頻,已成為全球科技、經濟乃至政治領域的重要話題。
在全球人工智慧技術競爭日趨白熱化的當下,中國科技企業正憑藉獨特的創新路徑,深度參與這場意義深遠的變革當中。業界評論普遍認為,DeepSeek的最大特點在於其作為開源模型,透過在模型架構、工程設計上的大量創新,實現了極致的效率提升,以更少的資料量和算力需求,達到了比肩全球領先閉源模型的效能表現,大幅降低了業界的開發成本和應用門檻,甚至改變了全球人工智慧的發展思路。
DeepSeek 的成功,也將更多優秀的中國 AI 企業推向世界舞臺的聚光燈下。近日,由麻省理工學院全資擁有的科技商業化智庫《麻省理工科技評論》(MIT Technology Review)刊發了一篇題為《關注DeepSeek之外的四家中國人工智慧初創公司》的報導,指出階躍星辰(Stepfun)、面壁智慧(ModelBest)、智譜AI(Zhipu)、無問芯穹(Infinigence AI)四家企業同樣展現出不遜於DeepSeek的技術實力與全球競爭力。
《麻省理工科技評論》於1899年在美國麻省理工學院創刊,是世界上最權威的科技商業媒體之一,也是世界上最古老的技術雜誌及影響力最大的科技商業化智庫之一,其每年釋出的 “十大突破性技術”榜單,更被視為全球科技發展的權威指南。
獲得《麻省理工科技評論》點名的這四家備受矚目的AI新銳中,首先是成立於2023 年4月,由前微軟高階副總裁姜大昕創立的階躍星辰。報導認為,雖然階躍星辰起步相對較晚,但其憑藉著一系列基礎模型的成功,迅速嶄露頭角。去年,階躍星辰已經發布了11款基礎AI模型,涵蓋了語言、視覺、影片、音訊以及多模態系統等多個領域,其大型語言模型Step-2引數超1萬億,在第三方基準測試網站LiveBench上,僅次於ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智慧由清華大學知名研究團隊於2022年共同創立。報導指出,面壁智慧專注於效率提升,順應端側模型發展趨勢,推出了MiniCPM系列模型,被形象地稱為“小鋼炮”。該系列模型專為智慧手機、個人電腦、汽車系統、智慧家居裝置乃至機器人等終端裝置的實時處理設計,其最新的MiniCPM 3.0 僅有40 億引數,但在多個基準測試中,效能與GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板電腦上實現了GPT-4o級別的效果。
同樣源於清華大學的智譜 AI,已發展成為一家與政府、學術界聯絡緊密的企業。智譜AI既專注於基礎模型研發,也基於模型開發了對話模型ChatGLM和影片生成工具清影(Ying)等一系列AI產品。其最先進的大語言模型 GLM-4-Plus 透過高質量合成資料訓練,降低成本的同時,還實現了與GPT-4相媲美的效能表現;視覺模型 GLM-4V-Plus則在賦予AI更多“智慧體”能力上邁出了重要一步。
同樣是清華系的初創企業無問芯穹,雖然僅僅成立不滿兩年,但卻已經吸引了近10億元(1.4億美元)的融資,並被譽為“中國CoreWeave”。報導指出,該公司專注於AI基礎設施領域而非模型開發,其核心競爭力在於透過“多元異構、軟硬協同”的核心技術,打造連線“M種模型”和“N種晶片”的“MxN”AI基礎設施新正規化,實現多種大模型演算法在多元晶片上的高效協同部署,相當於將來自不同品牌的晶片整合在一起形成“異構計算叢集”來執行各類AI任務。無問芯穹推出的Infini-AI異構雲平臺基於多元晶片算力底座,向大模型開發者提供極致價效比的高效能算力和原生工具鏈,為大模型從開發到部署的全生命流程降本增效,同時其大規模模型的異構分散式混合訓練系統HETHUB,可將AI模型訓練時長壓縮30%,進而打造具有中國特色的高效解決方案。
從DeepSeek到四大新銳,中國AI企業正以獨特的發展路徑重塑全球AI的競爭格局。憑藉在原創技術和工程層面實現突破,進而以更高的創新效率,快速追趕國際巨頭、構建全新商業模式,乃至樹立全球人工智慧發展新標準,正是這些中國創新企業的共同特質。隨著越來越多中國AI企業在全球舞臺上嶄露頭角,不僅將成為推動中國 AI 產業穩健前行的關鍵力量,更將為全球AI發展貢獻更多中國智慧,引領人工智慧產業邁向新的發展階段。