國產化CPU生態情況簡介

天翼雲開發者社群發表於2023-05-11

本文分享自天翼雲開發者社群《 國產化CPU生態情況簡介 》,作者 h****n

https://www.ctyun.cn/developer/article/408999404249157


國產化 CPU生態情況簡介

一、行業觀點

CPU 是底層硬體基礎設施中的核心,當前主流晶片架構為 ARM 和 X86,均為國外主導,晶片國產化率較低。“十五”期間,國家啟動發展國產 CPU 的泰山計劃,863 計劃也提出自主研發 CPU。2006 年核高基專項啟動,國產 CPU領域迎來新一輪的國家支援,鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優質國產 CPU 廠商快速崛起。

海光資訊和兆芯採用 x86 架構 IP 核心授權模式 ,可基於公版 CPU 核進行最佳化或修改,優點是效能起點高、生態壁壘低,缺點是需要支付授權費、自主創新程度較低。海光最新一代 CPU 已接近國際同類高階產品水平,併相容x86 指令集,具備較高的應用相容性和較低的遷移成本,在電信、金融、網際網路等領域優勢顯著,其與第一大股東中科曙光的高效協同為公司產品放量打下了深厚基礎。

華為鯤鵬和天津飛騰採用 ARM 指令集架構授權 ,可自行設計 CPU 核心和 SOC,也可擴充指令集,自主化程度相對較高。華為鯤鵬 920 處理器是業內首-款 7nm 資料中心 ARM 處理器,非 X86 架構晶片中鯤鵬 920 晶片在算力維度方面優勢領先,且發展至今已經達到可以與 X86 晶片相匹配的效能。鯤鵬計算產業經過多年發展,已涵蓋全棧 IT基礎設施、行業應用及服務。飛騰則基於 PKS 體系,在黨政信創領域市佔率領先,市佔率高且產業鏈更為完整。

龍芯中科採用自研的 LoongArch 指令集 ,擁有較強的自主性和可靠性,其秉承獨立自主和開放合作的運營模式,從指令集 /IP 核授權、到晶片級/主機板級開發以及系統核心應用等方面對生態夥伴進行全方位的開放支援。 申威採用自研的申威 64 位指令集 ,重點應用於特種領域,努力實現在國防和網路安全領域晶片的自主可控。隨著其產品技術的日益成熟,其生態也不斷趨於完善。

 

二、國產六大 CPU廠商分析

更正:龍芯中科為自研 LoongArch架構

1、華為鯤鵬—快速崛起的領-導者

華為晶片基於 ARM 架構,研發五大晶片族,實現全場景佈局。 華為自研晶片產品主要包括伺服器晶片鯤鵬系列、手機 SOC 晶片麒麟系列、人工智慧晶片昇騰系列、5G 基站晶片天罡系列、5G 終端晶片巴龍系列等,以及一系列專用晶片,如凌霄晶片、NB-IoT晶片、影片編碼解碼晶片以及 SSD 控制晶片等。

鯤鵬處理器基於 ARM v8 指令集永-久授權,自主研發設計處理器核心,相容全球 ARM生態,並圍繞鯤鵬處理器打造了“算、存、傳、管、智”五個子系統的晶片族,實現全場景處理器佈局。華為從 2004 年開始投資研發第一顆嵌入式處理晶片,迄今形成了以“鯤鵬+昇騰”為核心的基礎晶片族。當前,Kunpeng晶片族正沿著“量產一代、研發一代、規劃一代”的策略持續升級產品。

2019 年華為釋出鯤鵬 920 處理器。 該晶片支援 ARMv8.2 指令集,是行業內首-款 7nm資料中心 ARM 處理器,專為大資料處理以及分散式儲存等應用而設計。鯤鵬 920 由華為自主研發,採用多發射、亂序執行、最佳化分支預測等多種手段提升單核效能。鯤鵬920 擁有 64 個核心,整合 8 通道 DDR4,可以提供多個介面,主頻可達 2.6GHz,總記憶體頻寬最高可達 1.5Tb/s,支援 PCIe 4.0 及 CCIX 介面,總頻寬 640Gbps。華為 Cache一致性匯流排(HCCS)的 480Gbps 片間互聯支援最多四顆鯤鵬 920 互聯和最高 256 個物理核的 NUMA 架構,保證了鯤鵬 920 超強算力的高效輸出。此外,在 Memory 子系統上也進行了大量的最佳化,採用當前典型的 3 級 Cache 的架構,對 Cache 大小以及延時進行了最佳化設計。

X86 架構晶片中鯤鵬 920 晶片在算力維度方面優勢領先,且發展至今已經達到可以與 X86 晶片相匹配的效能 。參照鯤鵬 920 不同核心下與競品晶片的對比,其在 48 核的時候,整數打平 intel 至強 8180,功耗低 20%。而 64 核心的鯤鵬 920,則比過 intel至強 8180 33%左右。其中至強 8180 是 intel 用於伺服器的旗艦晶片,採用 28 核心,2.5GHz 頻率,廣泛應用於 X86 伺服器中。

構建 openEuler 開源社群,高效推進處理器深度最佳化。 openEuler 開源社群以 Linuxkernal、GNU 等為上游社群,定期同步上游社群創新成果,並針對 Kunpeng 處理器進行深度最佳化,提供完整 OS 開發環境和上下游生態驗證環境,使開發者和使用者高效開展需求適配、生態整合和測試認證。在此基礎上,社群定期釋出穩定的 openEuler LTS(長期支援版本),提供對應的社群支援(檔案、補丁、維護等),使 OS 廠家基於openEuler LTS 進一步開發商業發行版,同時支援網際網路等使用者基於 openEuler LTS自行定製 OS。openEuler 開源社群透過社群理事會、技術委員會、使用者委員會、營銷委員會等組織,形成可持續發展的社群治理架構,對社群進行開放治理。

鯤鵬計算產業將快速提升 Kunpeng 處理器生態建設。 鯤鵬計算產業是基於 Kunpeng處理器構建的全棧 IT 基礎設施、行業應用及服務,包括 PC、伺服器、儲存、作業系統、中介軟體、虛擬化、資料庫、雲服務、行業應用以及諮詢管理服務等。鯤鵬計算產業路線是華為提出的六大數字技術生態之一,除鯤鵬外還包括昇騰、HMS、鴻蒙、華為雲、MDC(智慧駕駛計算平臺)。其中鯤鵬是華為面向政企市場,與地方政府和合作夥伴共同打造鯤鵬產業生態、構建具有國際競爭力的通用計算技術路線。

鯤鵬計算產業生態不斷擴大,賦能 Kunpeng 處理器長遠發展。 鯤鵬計算產業打造完備基礎產品,開放硬體、開源軟體,充分賦能合作伙伴,此外鯤鵬還有望帶動國內軟硬體領域的廠商加速發展。

華為鯤鵬得到地方政府的大力支援。 2020 年 4 月,成都市印發《關於加快培育發展鯤鵬產業工作方案的通知》,明確 2025 年成都鯤鵬產業規模超過 500 億元,併成為全國領先的鯤鵬軟體生態基地、鯤鵬硬體製造基地和鯤鵬應用示範基地,該案例為鯤鵬產業體系的推進提供了重要模板。

 

2、飛騰—PKS 生態的主導者

飛騰資訊科技有限公司由中國電子資訊產業集團、天津市濱海新區政府和天津先進技術研究院於 2014 年聯合成立。 公司致力於飛騰系列國產高效能、低功耗通用計算微處理器的設計研發和產業化推廣,同時聯合眾多國產軟硬體生態廠商,提供基於國際主流技術標準、中國自主先進的全國產資訊系統整體解決方案,支撐國家資訊保安和重要工業安全。

2020 年以來,飛騰對高效能伺服器 CPU、高效能桌面 CPU、高階嵌入式 CPU 三條產業線進行了全面的品牌升級。 高效能伺服器 CPU產品線統一以飛騰騰雲S系列進行命名,高效能桌面 CPU 產品線以飛騰騰銳 D 系列進行命名,高階嵌入式 CPU 產品線統一以飛騰騰瓏 E 系列進行命名,提供定製化、契合各行各業嵌入式應用的解決方案。

公司於 2020 年釋出的騰雲系列新一代可擴充套件多路伺服器晶片騰雲 S2500 與 FT 2000+相比效能大幅提升。 在整機效能方面, 雙路的 SPECint 分值為原來的 2 倍,四路的SPECint 值為原來的 3.5 倍;在分散式資料庫效能方面,雙路伺服器的 tpmc 值線性提升至原來的 2 倍,四路的 tpmc 值線性提升至原來的 4 倍; 在雲桌面支援方面, 雙路伺服器支援虛擬機器 70 個,是原來的 2.5 倍,四路伺服器支援 140 個,是原來的 5倍。

相比上一代產品 FT-2000/4 桌面處理器晶片,最新飛騰高效能桌面 CPU 騰銳 D2000的效能大幅躍升,頻寬達 18.7GB/s,SPECint 分值為 97.45,SPECfp 分值為 94.62,接近原來的 2 倍,在計算能力上得到進一步提升,併兼顧桌面終端與邊緣伺服器,極大地豐富了應用場景。此外,騰銳 D2000 與 FT-2000/4 產品管腳相容,使用者可以實現現有系統的原位拔插代換、無縫相容。此設計能夠大幅降低產品研發成本,同時降低整機合作伙伴的開發難度,加快開發進度。

飛騰生態發展迅速,為行業自主創新做出了重要貢獻。在生態建設方面, 飛騰與 1600餘家國內軟硬體廠商打造完整生態體系,與 6 大類 1000 餘種整機產品,2600 餘種軟體和外設完成了適配;基於飛騰桌面 CPU 的終端已形成了較為完整的生態圖譜,可覆蓋從整機硬體、基礎軟體到上層的應用。基於飛騰桌面 CPU 的終端產品已能夠實現海量 Android 應用的執行,基於飛騰 CPU 的軟體生態也在不斷豐富和完善。

PKS 體系領-導者,已成為行業生態構建的標杆。 PKS 體系最早由飛騰 CPU(Phytium)和麒麟作業系統(Kylin)的“PK 體系”發展而來。依託飛騰全新的硬體級安全機制,以相關可信技術為支撐,PK 體系融合“S-Security”的立體防護安全鏈,升級為 PKS體系,並全球首創將“可信計算 3.0”技術融入到 CPU、作業系統和儲存控制器中,實現底層構架的本質安全,併成為國內首-個計算機軟硬體基礎體系標準。

對比鯤鵬與飛騰的生態構建可以發現,鯤鵬技術路線比 PKS 路線有較明顯的技術和產品優勢,PKS 技術路線比鯤鵬技術路線有較明顯的安全優勢。鯤鵬在硬體終端、雲平臺、人工智慧、中介軟體等方面具有絕對優勢,但在安全方面略遜一籌。PKS 路線的一個非常顯著的特點是“注入安全”,即“PKS”體系中的“S”,PKS 路線將安全貫穿於從 CPU、OS 底層,到產品服務應用,一直到供應鏈安全保障的全過程,為信創工程提供內生安全、過程安全和供應鏈安全的全流程服務。

 

3、海光資訊—效能領先的實幹者

海光資訊成立於 2014 年,主要從事高階處理器、加速器等計算晶片產品和系統的研究開發。 海光處理器相容市場主流的 X86 指令集,具有成熟而豐富的應用生態環境。海光處理器內建專用安全硬體,支援通用的可信計算標準,能夠進行主動安全防禦,最-大程度避免安全漏洞和隱患,滿足資訊保安的發展需求。面向企業計算、雲端計算資料中心、大資料分析、人工智慧、邊緣計算等眾多領域,公司提供了多種形態的海光處理器芯,滿足網際網路、電信、金融、交通、能源、中小企業等的廣泛應用需求。從股權結構上看,主要從事研究、開發、生產製造高效能運算機、通用伺服器及儲存產品的中科曙光是公司的第一大股東,二者的深入合作為海光資訊的生態打造提供了有力保障。

海光資訊與 AMD 公司合作密切。 2016 年,AMD 公司和海光資訊合資成立了成都海光微電子技術有限公司和成都海光積體電路設計有限公司,授權海光微電子 x86 指令集和Zen 架構,AMD 獲得 2.93 億美元的授權費。海光積體電路購買海光微電子的 IP 授權,以此為基礎開發 CPU。海光積體電路與海光微電子的股權結構保證了公司在規避了英特爾的 x86 授許可權制的同時,又使得海光 x86 CPU 成為內資公司開發的產品,滿足了國家產業政策和創新的需求。

海光 CPU 主要面向複雜邏輯計算、多工排程等通用處理器應用場景需求,相容國際主流 x86 處理器架構和技術路線,具有先進的工藝製程、優異的系統架構、豐富的軟硬體生態等優勢。此外,海光 CPU 支援國密演演算法,擴充了安全演演算法指令,整合了安全演演算法專用加速電路,支援可信計算,大幅度提升了高階處理器的安全性,可以在資料處理過程中為使用者提供更好的安全保障。

公司 2019-2021 年收入 CAGR 高達 146.88%,2021 年淨利潤扭虧為盈。 2019-2021 年,公司營業收入從 3.79 億迅速增長至 23.1 億,2021 年淨利潤實現轉正,公司規模化效應逐漸顯現。

電信和金融已成為公司產品應用最多的兩個領域。 近年來公司推出海光二號處理器、深算一號 DCU 處理器,不斷豐富產品線,加大市場開拓力度,逐步形成了較為完善的基於海光處理器的產業生態環境。基於前期電信、金融、網際網路等行業對公司產品的認可,公司在電信運營商集採、金融行業入圍等方面市場份額增長較快,公司產品在相關重點行業銷量逐漸提升。

公司產品基於 AMD Zen1 架構,產品效能起點較高。 選取 Intel 在 2020 年(與海光7285 同期)釋出的 6 款至強鉑金系列產品(能夠反映 Intel 2020 年釋出的主流 CPU產品的效能)與海光 7285 進行效能對比可以發現,在典型場景下,公司最新一代 CPU相關產品均已接近國際同類高階產品水平。

海光資訊的基礎架構具備先天生態優勢。 微軟和英特爾憑藉自身規模效應和技術優勢,使 Windows 和 Intel CPU 佔據了絕大部分市場份額,並結成 Wintel 聯盟。Wintel 聯盟的基本特點是基於 x86 架構最佳化各類軟體應用,使得 x86 架構具有顯著產業生態優勢,同時軟硬體環境的成熟度相較於其他架構也具有明顯優勢。我們認為海光 CPU相容 x86 指令集,使得其具備較高的應用相容性,較低的遷移成本,有望受益於 x86完備的生態體系。

公司第一大股東中科曙光與公司的發展形成良好的協同效應。 中科曙光的業務結構主要包含高效能運算機(包括伺服器和其相關配套產品)、儲存產品以及圍繞高階計算機的軟體開發、系統整合與技術服務三大類別。海光提供效能優異的國產 CPU,為曙光的戰略轉型提供支點。中科曙光透過在計算產業的全面佈局已具備優質的客戶資源和銷售渠道,曙光伺服器中應用海光產品的比例超過 30%,為海光晶片的放量打下了深厚基礎。

 

4、兆芯—合資 CPU 的探路者

兆芯是成立於 2013 年的國資控股公司,總部位於上海張江,在北京、西安、濟南等地設有子公司,公司同時掌握中央處理器、圖形處理器、晶片組三大核心技術,具備相關 IP 自主設計研發的能力。 公司堅持自主創新與相容主流的發展路線,憑藉成熟的軟硬體生態,為使用者提供效能卓越、相容性優異且安全可靠的通用處理器和晶片組等產品。

自成立以來,公司已成功研發並量產多款通用處理器產品,並形成 “開先”、“開勝”兩大產品系列,產品效能不斷提升,達到國際主流同等水平。 作為國內率先實現主頻 3.0GHz 關鍵突破的國產通用處理器,兆芯開先® KX-6000 系列處理器榮獲“第二屆積體電路產業技術創新獎”、“2019 年中國 IC 設計成就獎”和“第二十屆中國國際工業博覽會金獎”,併入選“2019-2020 年度上海設計 100+”優秀成果。

兆芯自主研發的通用處理器產品涵蓋 “開先”、“開勝”兩大系列 ,具備良好的作業系統和軟硬體相容性,生態體系成熟,支援構建桌上型電腦、筆記本、一體機、雲終端等多種型別的桌面整機以及伺服器、儲存等產品。此外,在嵌入式領域,也已經有不同規格基於兆芯通用處理器的工業主機板、模組化電腦、工業整機、 Box PC、工業級伺服器、網路安全平臺等產品陸續推出。 

在晶片設計研發和技術創新方面 ,兆芯自主創新研發的國產通用處理器效能穩定可靠,產品體驗達到國際主流同等水平。 在產業鏈合作方面 ,兆芯積極協同產業合作伙伴,為政府、金融、教育、交通、能源、網路安全、醫療、通訊等行業提供多樣化的產品和解決方案,助力客戶應用實現平滑遷移,目前,基於兆芯新一代處理器( KX-6000/KH-30000),聯想、同方、東海、海爾、銳捷、升騰、攀升等品牌已經推出了 20 餘款不同形態的桌面 PC 及伺服器產品,研華、研祥、盛博、威強電、信步、安勤、深惟、華北工控、漢智興、智微、芯傑英、經緯天地、凌壹、海川智慧、愛鑫微、眾新等 30 多種工業主機板、工業電腦模組和嵌入式計算平臺,此外 30 多種網路安全平臺也相繼推出。

開先 KX-6000/開勝 KH-30000 系列處理器是業內第一款完整整合 CPU、GPU、晶片組的SoC 單晶片國產通用處理器,這為整機系統的開發提供了較大的便利條件,同時也更利於控制成本。

透過 KX-6000 系列處理器橫向對比,8 核心的 KX-U6780A 產品效能與第七代的 4 核心英特爾 i5 整體水平仍存在差距,尤其是單核效能不足 7 代 i5 一半,但整數效能方面對英特爾 i5 實現了反超。

開先 KX-6000/開勝 KH-30000 系列處理器採用了新一代高速低功耗核心。 新一代核心對宏指令和多媒體效能進行了進一步的最佳化和增強,針對微架構流水線也進行了大幅的改進和最佳化,加上功耗方面的最佳化以及高頻物理實現和高頻防抖 /降噪控制等方面的改善,開先 KX-6000/開勝 KH-30000 系列處理器的單晶片效能相比上一代產品提升了多達 50%,同頻下的效能功耗比則是上代產品的 3 倍。

 

5、龍芯中科—自主架構的先驅者

龍芯中科是中國科學院計算所自主研發的通用 CPU,採用自主 LoongISA 指令系統,相容 MIPS 指令,所有 IP 模組皆為自主設計,擁有片內安全機制,可信性高。龍芯處理器以 32 位核 64 位單核及多核 CPU/SOC 為主,主要面向高階嵌入式、個人電腦、伺服器和高效能機等應用。2002 年 8 月誕生的“龍芯一號”是我國首枚擁有自主智慧財產權的通用高效能微處理晶片。龍芯從 2001 年至今共開發了 1 號、2 號、3 號三個系列處理器和龍芯橋片系列,在政企、安全、金融、能源等應用場景得到了廣泛應用。

公司產品體系分為三大系列, 龍芯 1 號系列為低功耗、低成本的專用嵌入式 SoC 或MCU 處理器 ,主要面向嵌入式專用應用領域,如物聯終端、儀器裝置、資料採集等,主要根據需求定製; 龍芯 2 號系列為低功耗通用處理器, 採用單晶片 SoC 設計,應用場景面向工業控制與終端等領域,如網路裝置、行業終端、智慧製造等,定位於 Intel的凌動系列; 龍芯 3 號系列為高效能通用處理器 ,通常整合 4 個及以上 64 位高效能處理器核,與橋片配套使用,應用場景面向桌面和伺服器等資訊化領域,對標 Intel的酷睿/至強系列。

LoongArch 具有較強的擴充套件性和自主性。 LoongArch 包括基礎架構部分和向量指令、虛擬化、二進位制翻譯等擴充套件部分近 2000 條指令,具有較好的擴充套件性。自主性方面,LoongArch 指令系統從整個架構的頂層規劃,到各部分的功能定義,再到每條指令的編碼、名稱、含義,都進行了自主設計,具有充分的自主可靠性。此外,LoongArch充分考慮相容需求,在定義時充分考慮了 MIPS、X86、ARM、RISC-V 等主要指令系統的特徵,摒棄了傳統指令系統中部分不適應當前軟硬體設計技術發展趨勢的陳舊內容,吸納了近年來指令系統設計領域諸多先進的技術發展成果。同原有相容指令系統相比,不僅在硬體方面更易於 效能、低功耗設計,而且在軟體方面更易於編譯最佳化和作業系統、虛擬機器的開發。

基於自主指令系統( LoongArch)的 3A5000/3B5000 是龍芯當前重點發展產品。 龍芯 3A5000/3B5000 是面向個人計算機、伺服器等資訊化領域的通用處理器,基於龍芯自主指令系統(LoongArch)的 LA464 微結構,並進一步提升頻率,降低功耗,最佳化效能。在與龍芯 3A4000 處理器保持引腳相容的基礎上,頻率提升至 2.5GHz,功耗降低30%以上,效能提升 50%以上。龍芯 3B5000 在龍芯 3A5000 的基礎上支援多路互連。

3A5000 在 SPEC CPU 2006 BASE 效能測試中的表現來看,龍芯 3A5000 單核定點為25.1 分,單核浮點為 26 分。相比 intel i5 9500 六核 14nm 的確有不小的差距,但單核定點與國產 ARM V8 四核 7nm 處理器不相上下,單核浮點略優於國產 ARM V8 四核 7nm 處理器。龍芯 3A5000 對比國產 ARM V8 八核 14nm 處理器的單核定點則高出近 10 分,單核浮點則高出近一倍。多執行緒測試中,intel i5 9500 六核 14nm 處理器依然表現最-佳,而龍芯 3A5000 的多核定點與多核浮點均高於國產 ARM V8 四核 7nm處理器,由於國產 ARM V8 八核 14nm 處理器核心數量上具有一定的優勢,因此定點和浮點的分數要高於龍芯 3A5000 和國產 ARM V8 四核 7nm 處理器。

龍芯 3A5000 在 Stream Copy 測試子項效能中表現出色。 Stream 是業界主流的記憶體頻寬測試程式,測試行為相對簡單可控。該程式對 CPU 的計算能力要求很小,對 CPU記憶體頻寬壓力很大。隨著處理器核心數量的增大,記憶體頻寬並沒有隨之成線性增長,因此記憶體頻寬對提升多核心的處理能力就越發重要。在Stream Copy測試子項效能中,龍芯 3A5000 的表現超過了 intel i5 9500 六核 14nm 處理器。其中 Copy 單線效能獲得 16864 分,多線效能獲得 21873 分。國產 ARM V8 八核 14nm 處理器和國產 ARM V8四核 7nm 處理器分數相差不大,但整體表現比龍芯 3A5000 稍遜一籌。

龍芯秉承獨立自主和開放合作的運營模式,從指令集 /IP 核授權、到晶片級/主機板級開發以及系統核心應用等方面對生態夥伴進行全方位的開放支援,幫助生態夥伴進行技術創新升級。 目前龍芯的資訊化合作夥伴達到上千家,可以提供基於龍芯從端到雲的完整解決方案。相關軟硬體開發人員數萬人,已經形成強大的產業鏈與生態支撐能力。

龍芯開源社群( )是龍芯 CPU 的基礎軟體生態建設平臺,由龍芯中科組織並聯合產業鏈合作廠商、國際開源軟體社群及開源愛好者共同參與建設。社群以“開源、開放”的形式進行管理,設定 BIOS、Linux 核心、GCC 編譯器、Java 虛擬機器、瀏覽器、媒體解碼庫、圖形桌面、KVM 虛擬機器等重要基礎軟體專案。經過多年建設,資訊化應用中的主流程式語言和開發環境已在龍芯平臺上得到支援。

 

6、申威—特種領域的引領者

成都申威科技有限責任公司成立於 2016 年,公司依託國家資訊保安發展戰略,主要從事對申威處理器的產業化推廣,核心業務包括申威處理器晶片核心、封裝設計、技術支援服務及銷售,小型超級計算機研發、測試、銷售、服務及核心部件生產,基於申威處理器的軟體、中介軟體開發,嵌入式計算機系統定製化產品服務,積體電路 IP核等智慧財產權授權。

申威處理器以 Alpha 指令集為基礎進行擴充,高度自主可控。 Alpha 指令集由美國 DEC公司研製,主要用於 64 位的 RISC 微處理器。DEC 公司後被美國惠普收購,無錫江南計算所購買了 Alpha 指令集的所有設計資料。江南計算所基於原來的 Alpha 指令集,開發出了更多的自主智慧財產權的指令集,並研製了申威指令系統,推出了申威處理器。申威處理器是在國家"核高基"重大專項支援下,由上海高效能積體電路中心研製的全國產處理器。首顆申威處理器代號“SW-1”,於 2006 年研製成功,“SW-1”基於 DEC公司 Alpha 架構,130nm 製程,主頻為 900MHz。 

出於安全效能以及智慧財產權角度,申威在研發出第一代基於 Alpha 指令集的 CPU 後,將指令集替換為自研的自主可控申威 64 位指令集,完全區別於原有 Alpha 指令集。申威處理器專注於高效能運算,尤其是在伺服器領域,浮點運算算力與同期外國處理器相當。 申威 SW26010 是中國首-個採用國產自研架構且效能強大的計算機晶片。

申威 26010 處理器的峰值效能大於每秒 12.5 萬萬億次浮點運算結果,峰值速度、持續效能、效能功耗比排在世界前列。 2016 年法蘭克福世界超算大會上,“神威·太湖之光”搭載該處理器登頂國際 TOP500 榜單之首。隨後,我國科研人員依託“神威·太湖之光”超級計算機的應用成果首-次榮獲“戈登·貝爾”獎,實現了我國高效能運算應用成果在該獎項上零的突破。

申威在伺服器領域向上至超算領域的應用場景中效能強大,優勢較為明顯。 2016 年 6月 20 日,搭載了 40960 顆申威 SW26010 並執行國產作業系統神威睿思的神威太湖之光獲得全球超級計算機第一名,神威太湖之光峰值計算速度達每秒 12.54 億億次,是全球首臺峰值計算速度超過十億億次的超級計算機,持續效能為每秒 9.3 億億次,軟體硬體並行,均為申威自主設計。 

申威 8A 晶片採用最新的第四代申威處理器核心(簡稱 Core4)。Core4 核心繼續採用超標量流水線結構,支援亂序發射、亂序執行、推測執行,並首-次採用 SMT 技術,支援每個核心同時執行兩個執行緒。申威 831 相比上一代 4 核 CPU 申威 421 在功耗相當的前提下,效能提升 2 倍以上,下一代產品申威 4E 相比申威 831 效能再提升 50%以上,與 Intel 中端桌面處理器相當;申威下一代伺服器產品威鑫 8A 與 Intel 中端伺服器處理器相當。

經過長期穩定的研發,基於系列申威晶片的各種產品也逐漸增多,在保障特種領域應用和國家戰略任務的前提下,隨著其產品技術的日益成熟,其生態也不斷完善。同時,申威 CPU 的各種開發支撐系統也日趨成熟。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70014251/viewspace-2951498/,如需轉載,請註明出處,否則將追究法律責任。

相關文章