Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?

机器之心發表於2020-07-16

Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?

CPU是針對應用和網路進行設計的處理器,是標量處理器。GPU是針對圖形和高效能運算、以向量處理為核心的處理器,而Graphcore IPU是針對計算圖的處理來設計的處理器,應用了大規模並行MIMD的處理器核。

Graphcore執行長Nigel Toon認為,透過使用IPU,客戶的運營成本可以降低10到20倍,從而可以更快地使用新一代硬體。

撰文 | 澤南、徐丹

明星AI公司Graphcore昨天釋出了「全世界最精密」的AI晶片:第2代IPU GC200。這塊晶片採用臺積電7奈米制程,包含多達594億個電晶體,是上一代IPU的八倍,這個數字超過了今年5月英偉達推出的最新安培架構GPU Tesla A100。

這塊GC200晶片內含1472個獨立的處理單元,透過2.8Tb/s的頻寬連結容量高達900MB的片上儲存。一代IPU的絕大多數設計都延續到了二代平臺上。與前代產品相比,二代IPU核心數量增加 20%,片上 SRAM 增加333%,可擴充套件性則提升了 16 倍。

在GC200的基礎之上,Graphcore推出了全新的IPU主機M2000,一臺這樣的機器包含四塊GC200晶片,可輸出1petaflop的AI算力。這家公司表示,M2000可以實現「即插即用」,使用者可以用這種形式將多達64,000塊IPU並聯在一起,實現16 exaflops的算力。

近年來,國內外AI晶片公司,甚至科技公司都在為人工智慧任務負載尋求更高效的計算方式。深度學習AI模型的訓練通常需要高度並行化的處理流程,這一方面的市場長期被英偉達GPU佔據,而面向AI訓練的專用晶片包括谷歌TPU,華為昇騰,以及國內AI創業公司燧原科技提出的雲燧等等。

在眾多AI晶片創業公司中,Graphcore是一個相對特殊的存在。這家來自英國的創業公司自2012年建立伊始就底氣十足,接連獲得數量巨大的融資,最近一次是今年2月的D+輪,獲得1.5億美元,估值19.5億美元。此前,它還獲得了人工智慧先驅,圖靈獎獲得者Geoffrey Hinton的青睞。

Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?

IPU晶片

根據目前Graphcore公佈的測試資料,第二代IPU晶片不論是在自然語言處理還是計算機視覺模型,不論訓練和推理效能都優於目前業內最好的GPU。

Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?


一 標價三萬美元起

根據Graphcore 的定義,IPU晶片即Intelligence Processing Unit,智慧處理單元,它是為承載人工智慧計算專門設計的,處理架構和GPU、CPU完全不同。

Graphcore高階副總裁兼中國區總經理盧濤表示,「CPU是針對應用和網路進行設計的處理器,是標量處理器。GPU是針對圖形和高效能運算、以向量處理為核心的處理器,而Graphcore IPU是針對計算圖的處理來設計的處理器,應用了大規模並行MIMD的處理器核。」

目前基於IPU的應用已覆蓋到包括自然語言處理、影像/影片處理、時序分析、推薦/排名及機率模型在內的多個機器學習應用領域。

在上一代IPU推出之後,Graphcore一直以雙IPU機器的方式出售自己的晶片。在二代IPU上市的同時,為了簡化落地時間,新一代晶片同樣是以四IPU機器的形式售賣。它被稱為 IPU-Machine (M2000),每臺售價為32,450美元。

相比之下,包含八塊A100晶片的英偉達DGX A100 可以輸出5PetaFLOPS 的 FP16 算力,售價 19.9 萬美元。

Graphcore執行長Nigel Toon認為,使用IPU會比使用英偉達提供的GPU更加高效、先進:「我們正在嘗試構建的是可以整合進現有計算基礎架構中的產品,提供更高的可擴充套件性。」Toon表示,透過使用IPU,客戶的運營成本可以降低10到20倍,從而可以更快地使用新一代硬體。

Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?

「IPU Machine」M2000伺服器元件。包括四個 IPU、整合的 100GbE 橫向擴充套件結構、PCIe 和附加的 DDR 記憶體。每臺裝置可提供 1 PFLOP 的 AI 算力和 450GB 的儲存空間。

使用上一代IPU的開發者可以無縫切換到新硬體上,與之相比,透過使用第二代產品他們還可以獲得平均8倍的效能。在由Graphcore晶片組成的資料中心內,數萬塊IPU需要透過全新IPU-Fabric技術進行連線,該技術提供了專用的低時延結構,可跨越機箱,在整個資料中心內實現IPU晶片的高度並行化。

Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?

Graphcore提出的IPU-Fabric技術。

在市場方面,執行長兼聯合創始人Nigel Toon表示,M2000現在面向早期訪問客戶,並且將在今年年底之前在金融服務,醫療保健,技術等領域的應用中向客戶廣泛普及。


二 中國將成為二代IPU最先商業化區域之一

Graphcore的IPU晶片一直以來都在業界有極高的評價,英國半導體支付Arm 的聯合創始人 Hermann曾說,「在計算機歷史上只發生過三次革命,一次是 70 年代的 CPU,第二次是 90 年代的 GPU,而 Graphcore就是第三次革命。」

人工智慧教父 Geoff Hinton 教授也曾表示:「我們需要不同型別的計算機來處理一些新的機器學習的系統。」並指出 IPU 就是這樣一個系統。包括 DeepMind 聯合創始人 Demis Hassabis、劍橋大學教授及Uber 首席科學家 Zoubin Ghahramani、加州大學伯克利的教授PieterAbbeel 以及 OpenAI 的幾位創始人都是Graphcore的品牌背書者。

憑藉IPU晶片,Graphcore目前已經獲得超過4.5億美元融資,戰略投資者不乏寶馬、博世、戴爾、微軟、三星等各行業巨頭,最近一輪融資在今年2月完成,公司估值已達19.5億美元。

值得一提的是,近年Graphcore正向中國市場大展拳腳。今年5月在中國舉辦了首場活動,並先後和阿里巴巴與百度達成合作,5 月 12 日,阿里巴巴宣佈Graphcore 支援 ODLA 的介面標準,5月20日,百度宣佈Graphcore 成為飛槳硬體生態圈的創始成員之一。

7月8日,Graphcore宣佈正式釋出中國首款基於IPU的開發者雲,部署早在金山雲上,該開發者雲將面向中國的客戶、大學、研究機構和個人研究者免費使用,使得前沿的機器智慧創新者可以輕鬆獲取 IPU 進行前沿AI 模型的雲端訓練與推理。

配合開發者雲,Graphcore 的創新社群也已全面正式上線。因此中國很可能成為Graphcore最新推出的第二代處理器技術最先實現商業化落地的區域之一。

Graphcore高階副總裁兼中國區總經理盧濤曾提到過Graphcore落地中國的市場戰略,表示在中國將會更加註重產品落地。

「目前,美國在IPU的落地與推進速度方面比中國要更快一些,不過現在中國的推進速度也愈發快速。這是因為美國使用者更多來自於較為活躍的研究者社群,而中國使用者非常注重產品落地。國外的AI應用更加側重研究,而中國更加看重產品化的訓練和產品化的推理,更加側重AI如何解決應用問題。」

為了適應這一市場差異,盧濤表示Graphcor會針對中國市場的需求進行產品定製化。「從服務角度而言,Graphcore中國目前有以定製開發為主要任務的工程技術團隊和以對使用者服務為主的現場應用團隊。工程技術團隊將根據中國本地需求將AI演算法模型在IPU上落地並進行功能性的開發加強工作,現場應用團隊幫助客戶完成現場技術支援工作。

「我們對中國市場的期望非常高,期望中國市場能夠佔到Graphcore全球市場的40%甚至50%。」盧濤說。

相關文章