Graphcore以IPU助力機器智慧實現下一波突破

lumin1020發表於2020-08-19

近一個月, Graphcore 的動作有點頻繁。

 

7月7日,Graphcore釋出Poplar SDK 1.2並且正式開放了Poplar計算相簿的一些原始碼。

 

7月8日,Graphcore在中國的IPU開發者雲也正式上線,面向中國的商業使用者、大學以及科研機構和創新者免費使用。

 

7月15號Graphcore釋出了第二代IPU以及基於第二代IPU處理器的一系列的產品。

Graphcore 高階副總裁兼中國區總經理盧濤

 

針對這一系列動作,IT168記者有幸採訪到了Graphcore高階副總裁兼中國區總經理盧濤,盧濤表示,在過去一年多的時間Graphcore已經發展成為了一家全球型的公司。目前Graphcore全球的辦公室遍佈了歐洲、亞洲,和北美。

 

具體來說,Graphcore的主要工作聚焦於三部分:第一部分是專門為AI應用從零開始設計的一個IPU的處理器。第二部分是基於IPU的處理器以及面向AI應用的Poplar軟體棧以及相關的一些開發工具。第三部分是圍繞硬體和軟體一起打造的IPU的平臺。

 

M2000:三大顛覆性技術突破

 

對於7月15號全新發布的Graphcore第二代產品Colossus Mk2 GC200,盧濤特別介紹了基於7奈米Mk2的IPU,Graphcore構建了IPU-Machine,這個型號叫M2000。IPU-M2000是一款即插即用的機器智慧刀片式計算單元,由Graphcore全新的7奈米Colossus第二代GC200 IPU提供動力,並由Poplar軟體棧提供全面支援。其設計便於部署,並支援可擴充套件至大規模的系統。這款纖薄的1U刀片機可提供1個PetaFlop的機器智慧計算,並整合了針對AI擴充套件最佳化的網路技術。

 

這一次釋出有三大顛覆性的技術的突破,第一塊是計算,第二塊是資料,第三塊是通訊。

如果從單一晶片來看,Colossus Mk2 GC200處理器是目前世界上最複雜的單一的處理器,基於臺積電7奈米的技術,這樣一顆處理器裡面整合了將近600億個電晶體,擁有250TFlops AI-Float的算力和900MB的處理器記憶體儲。處理器核心從我們上一代的1217提升到了1472個獨立的處理器核心,這樣一個處理器有將近9000個單獨的並行執行緒。相對於第一代產品,其系統級的效能提升了8倍以上。

 

在資料方面,Graphcore提出了一個叫IPU Exchange Memory,即交換式儲存的概念。Graphcore在M2000每個IPU-Machine裡面透過IPU Exchange Memory技術,提供了將近超過100倍的頻寬以及大約10倍的容量,這對於很多複雜的AI模型演算法是非常有幫助的。

通訊方面,Graphcore專門為AI橫向擴充套件設計了一個IPU-Fabric的結構。這樣一個IPU-Fabric可以做到2.8Tbps超低延時的結構,同時最多可以支援64000個IPU之間的橫向擴充套件。也就是說透過IPU-Fabric的技術,使用者可以把叢集無縫的從一個、幾個、幾十個、幾百個、幾千個,最後擴充套件到64000個IPU,透過直聯或者是透過乙太網的交換機等等技術做互聯。同時IPU-Fabric支援像AI運算裡面的像集合通訊或者是像全縮減(All-Reduce)的操作,這也是專門為AI應用從零開始設計的一個Fabric的技術。

 

軟體Poplar SDK賦能下一代機器智慧

 

對於IPU而言,它的設計目的很明確,是專為AI應用場景而打造的,而針對IPU產品Graphcore開發了Poplar軟體,它能夠使程式設計師用TensorFlow或者PyTorch的程式輕鬆達成目標。

 

Graphcore中國區技術應用總負責人羅旭透露,Poplar目前已經提供750個高效能運算元素的50多種最佳化功能,支援標準機器學習框架,如TensorFlow1、2,ONNX和PyTorch,很快也會支援PaddlePaddle。

 

概括來說,Graphcore此次最新發布的SDK 1.2主要特性包括三大方面:其一,整合了先進的機器學習框架。其二,進一步開放低階別的API,主要是為上層的演算法提供一個低層次API介面。最後增加框架支援,包括對PyTorch和Keras的支援。

 

除此之外,Graphcore還正式釋出了基於IPU的開發者雲,面向中國的客戶、大學、研究機構和個人研究者免費使用,使得前沿的機器智慧創新者可以輕鬆獲取IPU進行前沿AI模型的雲端訓練與推理,從而在新的一波機器智慧浪潮中取得關鍵突破。該開發者雲是中國首款IPU開發者雲,部署在金山雲上,使用了IPU-POD 64、IPU PCIe卡適配完成的浪潮NF5568M5伺服器和戴爾DSS8440伺服器。

 

這一系列動作,都在不斷印證IPU正在不斷幫助創新者在機器智慧中實現下一步演算法的突破。相信未來Graphcore晶片會為模型開發、演算法迭代帶來速度的提升,從而實現進一步的突破。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69965512/viewspace-2712788/,如需轉載,請註明出處,否則將追究法律責任。

相關文章