全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

机器之心發表於2021-10-19
10 月 18 日是 2021 雲棲大會的開放日,在 40000 平米的展區中,有一個展位格外引人注目。

這裡展示著阿里的「晶片家族」:從平頭哥首顆晶片玄鐵 910 到首顆自研高效能 AI 晶片含光 800,再到其他專用晶片,阿里這兩年的造芯之路「幾乎」一覽無餘,只有紅布之下是個例外。

「紅布之下是什麼呢?」「到明天雲棲大會開幕就知道了。」現場工作人員賣起了關子。

全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

十幾個小時後,阿里雲智慧總裁、達摩院院長張建鋒為我們揭開了謎底:原來這是阿里平頭哥晶片家族的新成員——倚天 710。它採用了業界最先進的 5nm 工藝,單晶片可容納高達 600 億顆電晶體。

全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

和專注於 AI 推理的含光 800 不同,倚天 710 是一顆通用伺服器晶片(CPU),也是 第一顆採用 5nm 工藝的伺服器晶片。它基於最新的 Armv9 架構,內含 128 核 CPU,主頻最高達到 3.2GHz,能同時兼顧效能和功耗。

在記憶體和介面方面,它整合了業界領先的 DDR5、PCIE5.0 等技術,能有效提升晶片的傳輸速率,並且可適配雲的不同應用場景。

在 SPECInt2017 基礎測試平臺上,倚天 710 的跑分達到 440 分,是當前效能最強的伺服器晶片,超出業界標杆 20%,能效比優於業界標杆 50%,能有效幫助資料中心節能減排。

阿里表示,倚天 710 是阿里雲推進「一雲多芯」策略的重要一步,也是阿里第一顆為雲而生的 CPU 晶片,即將在阿里雲資料中心部署。

「基於阿里雲『一雲多芯』和『做深基礎』的商業策略,我們釋出倚天 710,希望滿足客戶多樣性的計算需求,這款晶片不出售,主要是阿里雲自用。我們將繼續與英特爾、英偉達、AMD、ARM 等合作伙伴保持密切合作,為客戶提供更多選擇。」張建鋒介紹說。

全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

作為一家電商、物流、雲端計算、大資料、全球化等場景的公司,阿里擁有世界上最挑戰、最豐富的計算場景、網路場景、機器學習場景,需要使用大量晶片,自研晶片能夠降低阿里巴巴集團內部整體計算的成本。隨著倚天 710 的釋出,平頭哥已擁有處理器 IP、AI 晶片及通用晶片等產品家族。其中,玄鐵系列為 AIoT 終端晶片提供 IP,出貨量已達 25 億顆;含光 800 為人工智慧場景提供 AI 算力,服務於搜尋推薦、影片直播等行業;倚天 710 則透過阿里雲為雲上使用者提供算力。

從玄鐵到含光再到倚天,平頭哥三年完成「三級跳」

造芯難,一直是這兩三年的熱門話題,國內企業也在快馬加鞭補齊晶片設計的短板。但在高效能 CPU 市場上,國內還沒有太多成功的經驗。正如中國科學院微電子研究所所長葉甜春所說,積體電路就是一座喜馬拉雅山,而核心晶片就是珠穆朗瑪峰,「需要全世界最高階的技術。」

為了攀登這座高峰,阿里早在幾年前就開始了佈局。

2016 年,阿里投資軟體定義網路(SDN)晶片公司 Barefoot 以及翱捷科技、寒武紀、深鑑、耐能、中天微、恆玄科技等多家晶片公司;2017 年又成立了達摩院並組建了一支由半導體行業頂級專家組成的技術團隊。

2018 年,阿里全資收購大陸唯一擁有自主嵌入式 CPU IP core 的中天微。在那年的雲棲大會上,達摩院晶片研發團隊與中天微團隊合併,平頭哥半導體公司就此成立。
 
在之後的三年裡,平頭哥完成了「三級跳」:先是釋出了當時業界效能最強的 RISC-V 處理器玄鐵 710,讓基於 RISC-V 架構的高效能晶片成為可能,也讓晶片設計的門檻進一步降低;緊接著,在 2019 年的雲棲大會上,平頭哥又釋出了阿里第一顆晶片含光 800,這是一顆針對場景深度定製的晶片,創造了效能和能效比的兩項第一;再接著就是今年雲棲大會倚天 710 CPU 的問世

全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

CPU 是半導體行業設計門檻最高的晶片之一。為了達到通用伺服器 CPU 的效能、功耗要求,倚天 710 採用了很多領先的技術,包括 Armv9、DDR5、PCIE5.0 等,並對它們做了深度定製。

Armv9 是 ARM 公司在今年 3 月份正式推出的新架構。它的前輩——ARM 在 2011 年推出的第一款 64 位架構 Armv8——之前已經在伺服器領域取得了一些成功,不少企業基於此架構開發了可用於伺服器和超算領域的產品,個別產品也獲得了不錯的效果,讓 Arm 晶片從小型或移動裝置,進入了新的領域。Armv9 在此基礎上進一步創新。根據 ARM 官方的介紹,新的 Armv9 架構將會至少使用 10 年,未來兩代基於 Armv9 架構的處理器在效能上有望提升 30%。而且與 Armv8 架構不同的是,Armv9 架構的適用範圍更廣闊,其一系列改進不少都是為了 Arm 架構晶片可以實現高效能運算做鋪墊。

長期以來,X86 伺服器一直佔據市場主導地位,而且構建起了成熟的商業生態並佔據專利和標準制定等戰略高地。相比之下,ARM 晶片在伺服器領域存在效能劣勢以及生態環境的阻力。Armv9 的一系列改進為晶片企業進一步探索基於 Arm 的伺服器晶片設計提供了信心。

除了這些國際領先技術,倚天 710 還引入了許多自研技術,從前端架構設計到後端物理實現都是自研

在前端設計方面,為解決核數眾多條件下的頻寬瓶頸,平頭哥對於片上互聯作出特殊最佳化,採用新的流控演算法,降低系統反壓,有效提升了系統效率和擴充套件性,使單核高效能有效地轉化為整個系統的高效能。此外,透過新的系統地址到 DRAM 地址的轉換機制,倚天 710 支援安全、非安全隔離、多 NUMA、異常通道隔離多種特性,同時 DRAM 讀寫效率大幅度提升。

在後端物理實現方面,5nm 工藝對能量密度、晶片內部結構的佈局提出了極高的要求。為此,平頭哥在研發過程中靈活排程了 30 種不同的 EDA 軟體、深度定製時鐘網路和定製 IP 技術。此外,他們還採用了先進的多晶片堆疊技術,最後成功確保了晶片效能、功耗的最佳化。

倚天晶片的研製成功,標誌著平頭哥已經具備大型複雜晶片的研發設計能力,並進入與 Intel、AMD、AWS 等少數一流晶片公司競爭的行列。

從伺服器晶片釋出到玄鐵處理器開源,阿里端雲一體化戰略逐漸清晰

除了在縱深向不斷突破晶片技術外,平頭哥也在積極推動晶片生態的發展。在本次雲棲大會現場,平頭哥宣佈四款開源玄鐵 RISC-V 系列處理器(玄鐵 E902、E906、C906、C910),並開放相關工具及系統軟體。開發者可透過平頭哥 Github 和晶片開放社群(Open Chip Community)下載玄鐵原始碼,在此基礎上,實現開源 EDA 協同,創新硬體架構,豐富軟體應用生態。

這是繼釋出玄鐵 710 等處理器後,平頭哥在 RISC-V 生態上的重要舉措,也是全球首個商業處理器的開源,進一步拉近了 RISC-V 技術與開發者的距離,成為全球硬體開源的新里程碑。

全球首款5nm伺服器晶片,阿里平頭哥「倚天」問世:基於Arm架構,業界最強

AIoT 時代,RISC-V 架構因其開放、靈活的特性,有望成為繼 Intel X86、ARM 後的下一代廣泛應用的 CPU 架構。但是,當前 RISC-V 架構面臨應用碎片化、開發效率低、軟硬體適配難等問題,軟硬體生態尚未成熟。

玄鐵 RISC-V 系列處理器採用自研技術,覆蓋從低功耗到高效能的各類場景,支援 AliOS、FreeRTOS、RT-Thread、Linux、Android 等作業系統,並已成功應用於微控制器、工業控制、智慧家電、智慧電網、影像處理人工智慧、多媒體和汽車電子等領域。不久前,玄鐵 910 全球首次實現相容安卓,極大擴充了 RISC-V 架構面向開放生態的想象力。

阿里表示,對於正在上升期的 RISC-V 架構技術而言,只有更多的開發者和企業使用,才能共同推進生態進步,真正讓這一技術在晶片和作業系統等軟硬體層面實現繁榮,平頭哥也會從中受益。

伺服器晶片釋出、玄鐵系列處理器宣佈開源,阿里的端雲一體化戰略逐漸清晰。作為構築這一戰略的核心,達摩院、平頭哥及阿里雲,正在成為阿里巴巴三位一體的核心技術棧。平頭哥得到了達摩院和阿里雲的軟實力加持,例如基於達摩院的演算法能力,打破了演算法和硬體之間的鴻溝;基於阿里雲飛天雲平臺的優勢,快速形成了端雲一體晶片生態。
 
阿里表示,他們希望透過自研的強大技術平臺和生態系統能力,推動國產自主晶片的產業化落地。

相關文章