開源的勝利!RISC-V與AI今日全面「會師」

机器之心發表於2025-02-28
RISC-V 正在成為 AI 原生計算架構。

DeepSeek 的爆火震撼 AI 行業後,也帶動相關行業餘震不斷。其中,達摩院玄鐵在春節期間宣佈適配 DeepSeek-R1 系列蒸餾模型,引發半導體行業高度關注,新興的開源指令集 RISC-V 在 AI 方向展現出強勁的動力。

而今天的玄鐵 RISC-V 生態大會上傳來訊息,RISC-V 在高效能和 AI 方向上實現雙重突破,玄鐵首款伺服器級 CPU C930 下月開啟交付,其 AI 算力大幅提升,加快佈局「高效能+AI」RISC-V 全鏈路。

開源算力架構 RISC-V,會是開源 AI 的最佳搭檔嗎?

AI 模型變革
催生算力架構創新

一位晶片行業資深人士介紹,DeepSeek 不僅震撼了 AI 圈,也震撼了晶片行業。因為憑藉極致的深度最佳化,DeepSeek 大幅降低了大模型的訓練和推理成本,算力、記憶體、互聯原有平衡發生劇變,為算力架構的創新帶來了重大的機會。

傳統而言,AI 大模型需要較高的算力和記憶體要求,更適合部署在雲上,而不是端側。但 DeepSeek 的橫空問世,打破了大模型的高算力的路徑依賴,它不僅降低了訓練成本,也顯著降低了推理的要求,正幫助大模型從雲走向端。

具體來說,DeepSeek 降低了大模型對計算資源的需求,讓單機部署變得可能,能夠更好地適配邊緣和端側的裝置。AI 要深入千行百業,覆蓋多樣化的各種場景,也迫切需要從雲上走向端側,才能進一步滿足資料安全、個性定製、私有化部署等多樣化需求。

可以預見的是,由於 DeepSeek 技術的普及,AI 晶片的形態即將重構,從原本依賴雲端計算的大規模平行計算,到今天可以在邊緣裝置上獨立執行的低功耗晶片,AI 晶片正在走向多樣化和高效化。

這也引發眾多業界人士思考,什麼樣的算力架構才最適合 AI?

平行計算的 GPU 也許不是唯一解,序列計算(通用計算)也能成為 AI 計算基礎。業界實踐表明,DeepSeek 對多種計算體系都有較好地支援,在 CPU 上不僅能快速部署,還有較好的推理效果,這讓 CPU 重回牌桌。相比專用的 GPU,CPU 一大特點就是通用性強,排程簡單,能夠大幅降低算力需求併發揮同構計算的優勢。

而在 CPU 中,最引人注意的是後起之秀 RISC-V

春節期間,達摩院在搭載 RISC-V 處理器玄鐵 C920 的晶片上對 DeepSeek-R1 系列蒸餾模型進行適配,全程耗時僅 1 小時,體驗快捷順暢。這也意味著,DeepSeek 系列模型將能夠順利部署並流暢執行在全系列玄鐵 CPU 平臺及其他搭載 RISC-V 架構晶片的各類 AI 端側裝置上。

RISC-V 備受關注,一方面是因為其作為新興的指令集架構,有別於 x86、arm 的封閉或付費授權,堅持走開源開放的路線,其開源精神與 AI 天然契合。因其開源開放,RISC-V 已吸引了全球 1000 家企業的參與,從硬體設計到軟體工具鏈,生態系統迅速壯大。根據 RISC-V 國際基金會的資料,全球已經有超過 80 個不同的 RISC-V 晶片產品被推向市場。

另一方面是因為 RISC-V 的靈活性和可擴充套件性。RISC-V 允許開發者根據具體需求定製指令集。由於其指令集是模組化的,開發者可以根據不同的應用場景進行定製,這種靈活性是傳統架構無法比擬的。

從技術上來說,RISC-V 也非常適合新型的 AI 計算,RISC-V 的向量擴充套件(V-extension)能夠有效處理大規模並行運算,滿足 AI 計算的高效性需求。RISC-V 的開放架構與硬體加速模組可以協同工作,提升 AI 任務的執行效率。透過與 AI 演算法的深度結合,RISC-V 架構可以設計專用硬體加速單元,實現對特定 AI 模型的最佳化。

因此,不少晶片行業資深專家期待,RISC-V 能成為 AI 時代的原生計算架構。

今天,在阿里達摩院主辦的第三屆玄鐵 RISC-V 生態大會上,這樣的預期終於到了兌現的時候。
圖片
玄鐵首款伺服器級 CPU 即將交付
高效能與 AI「雙劍合璧」

在大會上,中國工程院院士倪光南表示:「開源 RISC-V 不僅是一項技術創新,更是一場影響未來計算架構的全球化變革。」作為「生而開源」的晶片指令集架構,RISC-V 在本輪半導體產業週期裡表現突出,從嵌入式系統加速挺進高效能等複雜場景,併為 AI 算力提供新選擇。

在 RISC-V 國際基金會 2024 年批准的 25 項標準中,超過一半與高效能或 AI 相關。RISC-V 國際基金會理事會主席 Lu Dai 在大會現場表示,RISC-V 指令集最激動人心的進展之一是 Matrix 擴充套件,將推動 RISC-V 成為 AI 領域令人敬畏的力量。

據預測,到 2030 年,RISC-V 的整體份額將達到 20%,在 AI 加速器中的佔比有望突破 50%。

在大會上,達摩院玄鐵拿出了新一代旗艦處理器、也是首款伺服器級處理器 C930

C930 通用效能算力達到 SPECint2006 基準測試 15/GHz。什麼概念?倪光南院士指出,RISC-V 要真正進入高效能運算市場,RISC-V 以 SPECint 2006 軟體測試,必須跑出超過 15 分的高效能標準。因此,C930 邁出了 RISC-V 里程碑式的一步。

此外,C930 搭載 512 bits RVV1.08 TOPS Matrix 雙引擎,將通用高效能算力與 AI 算力原生結合,並開放 DSA 擴充套件介面以支援更多特性要求。
圖片
同時,達摩院披露了 C908X、R908A、XL200 等玄鐵處理器家族新成員的研發計劃,向 AI 加速、車載、高速互聯等方向持續演進。具體而言,C908X 定位為玄鐵首款 AI 專用處理器,支援 4096 bits 超長資料位寬 RVV1.0 向量擴充套件;R908A 面向車規級晶片的高可靠需求;XL200 則將提供更大規模、更高效能的多簇一致性互聯。

配合玄鐵處理器的能力擴充,達摩院也基於 Linux、Android、RTOS 三套主流作業系統推出三套玄鐵 SDK,將多年來積澱的玄鐵軟體能力全面整合,以更完整、便捷、穩定的方式向行業輸出。其中,玄鐵 Linux SDK 提供包括 Hypervisor 虛擬化、CoVE 安全框架、玄鐵 AI 框架、高效能運算元庫在內的豐富子系統,助力 RISC-V 在高效能和 AI 場景的開發啟航。

在發展高效能軟硬體技術的同時,玄鐵更牽引產業上下游合作伙伴協同創新,加快佈局 RISC-V「高效能+AI」全鏈路生態。

阿里死磕
RISC-V 玄鐵引領國際開源社群

對於不太熟悉玄鐵的讀者,這裡簡單介紹一下。

2018 年,阿里巴巴樹立了主攻 RISC-V 方向的品牌:玄鐵;一年之後,首款處理器「玄鐵」C910 一誕生便是效能最強的 RISC-V 處理器。自那以後,玄鐵就一直是國際 RISC-V 生態的引領者,也是對國際開源社群貢獻最大的中國機構之一,目前在基金會技術委員會及 10 餘個技術小組擔任主席或副主席職位,積極推動著 AI 方向標準化的建設。

自 2019 年以來,玄鐵已經陸續推出了 13 款 RISC-V 處理器,覆蓋了覆蓋高效能、高能效、低功耗等不同場景,包括:

  • C 系列(Computing)主要針對高階伺服器、高階邊緣計算和行業類、消費級 IPC;
  • E 系列(Embedded)主要應用於高階 MPU 與各類 MCU;
  • R 系列(Reliability& Realtime)面向高階 SSD、通訊、高階工控、車載等場景;
  • XT-Link 則是 CPU 多簇互聯 IP。

迄今,玄鐵處理器出貨量超過 40 億顆,已成為國內 RISC-V 領域影響力和市場佔有率最大的處理器產品系列之一。

玄鐵在發展過程中,一邊持續突破 RISC-V 的效能天花板,不斷向更高效能進發,另一邊積極擁抱 AI,致力於推動 RISC-V 成為 AI 原生算力架構。

在指令集架構技術層面,利用 RISC-V 架構優異的開放性和靈活性,玄鐵很早定製了面向 AI 應用的指令集擴充套件。其提出的矩陣運算(Matrix)擴充套件擴充套件指令集、最佳化大模型核心運算元 GEMM,可以加速 AI 推理及訓練,提升端側 AI 能效。

在處理器上,玄鐵 C907 首次實現了 Matrix 擴充套件,較傳統方案提速 15 倍。升級版 C920 支援 Vector 1.0 和 Vector Crypto 技術,GEMM 效能指標提升超 7 倍,Transformer 運算元效能提升超 17 倍。而最新的旗艦處理器 C930 兼具 vector 和 matrix 雙引擎,有望成為成為端側 AI 大模型的好搭檔。

在軟體棧層面,玄鐵打造了端到端的 RISC-V AI 全棧軟硬體平臺,向晶片廠家提供通用的、高效的 AI 算力基礎設施,形成面向業務的流水線設計,真正了實現底層硬體設計到上層軟體工具鏈的便捷深度最佳化。該平臺已應用於雲端影片轉碼卡、AI 邊緣計算盒子、RISC-V 膝上型電腦等終端產品。

除了自身技術,達摩院 RISC-V 團隊也一直在引入產業上下游夥伴的力量,完善 RISC-V 的「高效能+AI」生態版圖。

去年大會上,RISC-V 開源膝上型電腦「如意 BOOK 甲辰版」驚喜亮相,實現大型商用軟體的穩定、流暢執行。此次,中科院軟體所進一步介紹「如意 BOOK 乙巳版」、智慧機器人、AI PC 等 RISC-V 高效能應用。

其中基於 C920 的 AI PC 原型機已跑通了 Llama、Qwen、DeepSeek 等開源模型,支援 AI 個人助手、AI 程式設計、視覺識別等 AI 應用,可以說打通了從開源硬體架構到開源作業系統、再到開源 AI 模型的「開源 AI 全鏈路」,單位計算能耗還降低了 30%。

除此之外,玄鐵還聯合合作伙伴構建了 RISC-V 影片編解碼方案、雲桌面解決方案等等實用解決方案。為了支撐更多行業的應用,玄鐵也把 RISC-V 算力佈局到了一體機、工控 AI、機器人等領域。

倪光南院士表示,玄鐵這種務實的投入和創新,正是 RISC-V 生態健康發展的重要驅動力。

開源的未來

DeepSeek 的成功是開源的成功,開源指令集架構 RISC-V 問世十幾年來,已經走出了與封閉式的 x86 和授權模式的 ARM 不同的發展路徑,讓業界看到了透過更加簡潔、更開放的方式進行架構創新的機遇,因此也在得到越來越多的認可。

它正在成為 AI 時代原生架構的最佳候選 —— 一方面 RISC-V 堅持開源開放,一直處於演進變化之中,能夠跟上 AI 極速變化的步伐;另一方面,RISC-V 擴充套件性強,可以透過移植適配與原有架構生態相容,也能作為原生架構支撐不斷湧現的新場景。

正如中科院軟體所 RISC-V 負責人郭松柳說的:「AI 軟體棧仍在高速演進,RISC-V 作為三大主流指令集架構中最靈活、最開放的一個,無疑最為適合 AI 時代的技術創新節奏。」

相關文章