Graphcore以IPU助力機器智慧實現下一波突破
近一個月,
Graphcore
的動作有點頻繁。
7月7日,Graphcore釋出Poplar SDK 1.2並且正式開放了Poplar計算相簿的一些原始碼。
7月8日,Graphcore在中國的IPU開發者雲也正式上線,面向中國的商業使用者、大學以及科研機構和創新者免費使用。
7月15號Graphcore釋出了第二代IPU以及基於第二代IPU處理器的一系列的產品。
Graphcore 高階副總裁兼中國區總經理盧濤
針對這一系列動作,IT168記者有幸採訪到了Graphcore高階副總裁兼中國區總經理盧濤,盧濤表示,在過去一年多的時間Graphcore已經發展成為了一家全球型的公司。目前Graphcore全球的辦公室遍佈了歐洲、亞洲,和北美。
具體來說,Graphcore的主要工作聚焦於三部分:第一部分是專門為AI應用從零開始設計的一個IPU的處理器。第二部分是基於IPU的處理器以及面向AI應用的Poplar軟體棧以及相關的一些開發工具。第三部分是圍繞硬體和軟體一起打造的IPU的平臺。
M2000:三大顛覆性技術突破
對於7月15號全新發布的Graphcore第二代產品Colossus Mk2 GC200,盧濤特別介紹了基於7奈米Mk2的IPU,Graphcore構建了IPU-Machine,這個型號叫M2000。IPU-M2000是一款即插即用的機器智慧刀片式計算單元,由Graphcore全新的7奈米Colossus第二代GC200 IPU提供動力,並由Poplar軟體棧提供全面支援。其設計便於部署,並支援可擴充套件至大規模的系統。這款纖薄的1U刀片機可提供1個PetaFlop的機器智慧計算,並整合了針對AI擴充套件最佳化的網路技術。
這一次釋出有三大顛覆性的技術的突破,第一塊是計算,第二塊是資料,第三塊是通訊。
如果從單一晶片來看,Colossus Mk2 GC200處理器是目前世界上最複雜的單一的處理器,基於臺積電7奈米的技術,這樣一顆處理器裡面整合了將近600億個電晶體,擁有250TFlops AI-Float的算力和900MB的處理器記憶體儲。處理器核心從我們上一代的1217提升到了1472個獨立的處理器核心,這樣一個處理器有將近9000個單獨的並行執行緒。相對於第一代產品,其系統級的效能提升了8倍以上。
在資料方面,Graphcore提出了一個叫IPU Exchange Memory,即交換式儲存的概念。Graphcore在M2000每個IPU-Machine裡面透過IPU Exchange Memory技術,提供了將近超過100倍的頻寬以及大約10倍的容量,這對於很多複雜的AI模型演算法是非常有幫助的。
通訊方面,Graphcore專門為AI橫向擴充套件設計了一個IPU-Fabric的結構。這樣一個IPU-Fabric可以做到2.8Tbps超低延時的結構,同時最多可以支援64000個IPU之間的橫向擴充套件。也就是說透過IPU-Fabric的技術,使用者可以把叢集無縫的從一個、幾個、幾十個、幾百個、幾千個,最後擴充套件到64000個IPU,透過直聯或者是透過乙太網的交換機等等技術做互聯。同時IPU-Fabric支援像AI運算裡面的像集合通訊或者是像全縮減(All-Reduce)的操作,這也是專門為AI應用從零開始設計的一個Fabric的技術。
軟體Poplar SDK賦能下一代機器智慧
對於IPU而言,它的設計目的很明確,是專為AI應用場景而打造的,而針對IPU產品Graphcore開發了Poplar軟體,它能夠使程式設計師用TensorFlow或者PyTorch的程式輕鬆達成目標。
Graphcore中國區技術應用總負責人羅旭透露,Poplar目前已經提供750個高效能運算元素的50多種最佳化功能,支援標準機器學習框架,如TensorFlow1、2,ONNX和PyTorch,很快也會支援PaddlePaddle。
概括來說,Graphcore此次最新發布的SDK 1.2主要特性包括三大方面:其一,整合了先進的機器學習框架。其二,進一步開放低階別的API,主要是為上層的演算法提供一個低層次API介面。最後增加框架支援,包括對PyTorch和Keras的支援。
除此之外,Graphcore還正式釋出了基於IPU的開發者雲,面向中國的客戶、大學、研究機構和個人研究者免費使用,使得前沿的機器智慧創新者可以輕鬆獲取IPU進行前沿AI模型的雲端訓練與推理,從而在新的一波機器智慧浪潮中取得關鍵突破。該開發者雲是中國首款IPU開發者雲,部署在金山雲上,使用了IPU-POD 64、IPU PCIe卡適配完成的浪潮NF5568M5伺服器和戴爾DSS8440伺服器。
這一系列動作,都在不斷印證IPU正在不斷幫助創新者在機器智慧中實現下一步演算法的突破。相信未來Graphcore晶片會為模型開發、演算法迭代帶來速度的提升,從而實現進一步的突破。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69965512/viewspace-2712788/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Graphcore釋出7奈米IPU二代:594億電晶體,能否挑戰英偉達?
- 工業智慧閘道器助力智慧製造,實現企業數字化管理
- 資料分析:AI智慧科技影響下,電話機器人實現落地AI機器人
- 雲擴RPA機器人突破電商疆界,助力電商自動化。機器人
- 亞馬遜雲科技助力西門子打造以生成式AI為基礎的智慧聊天機器人亞馬遜AI機器人
- 智慧配送機器人現狀機器人
- 工業閘道器如何助力垃圾電廠實現遠端監控智慧管理?
- 工業交換機助力智慧資料採集系統實現高效運營和智慧化管理
- Mavenir推出智慧物聯網平臺以實現更智慧的分析Maven
- 智慧升級:AntSK教你如何讓聊天機器人實現智慧聯網操作機器人
- 我生物質發電研究取得新突破,助力“雙碳”目標實現DYE
- linux下兩臺機器之間實現SSH認證Linux
- 工業智慧閘道器助力新能源動力電池生產線實現智慧製造轉型
- IBM推出新型工業化學機器人以實現實驗室自動化IBM機器人
- 推陳出新!突破機器人玩魔方「老套路」,OpenAI研究更具現實意義機器人OpenAI
- 客服RPA機器人助力客服行業向智慧化邁進機器人行業
- 零信任架構助力實現智慧安全3.0可信訪問架構
- 助力冬奧會,智慧機器人、雲轉播等現身華熙LIVE五棵松機器人
- Ubuntu 20.04.2 KVM虛擬機器動態遷移實現(下)Ubuntu虛擬機
- 倉庫智慧分揀機器人RFID,如何實現分揀工作機器人
- 實在智慧RPA機器人@你,電商RPA助力商家雙12步步高昇機器人
- 德州儀器全新產品系列不斷突破電源設計極限,助力工程師實現卓越的功率密度工程師
- Sophon AutoCV:助力AI工業化生產,實現視覺智慧感知AI視覺
- 實現智慧機器預測性維護收益的三個步驟
- 移動機器人如何在陌生環境中實現智慧導航?機器人
- 面向機器智慧的TensorFlow實戰4:機器學習基礎機器學習
- C++實現以秒為單位的計數器C++
- 如何實現實時機器學習? - huyenchip機器學習
- 區塊鏈賦能人工智慧,和數軟體為何能實現突破?區塊鏈人工智慧
- 滴普科技助力“智慧龍華”以數字化創新共建智慧政務標杆
- 西門子NX以ConvergentModeling實現產品設計的又一重大突破
- 與AI同行 定位導航技術助力服務機器人智慧升級AI機器人
- 工業智慧閘道器實現工業機器人資料採集遠端監控機器人
- 技嘉打造特色MOD主機,助力Knight9突破電競極限
- 回應DPU?英特爾基礎設施處理器(IPU)來了!
- 遊戲出海指南:使用者收益拆分助力突破變現瓶頸遊戲
- 實景三維助力智慧水利建設
- 是時候瞭解一波虛擬機器的類載入機制虛擬機