百度釋出全球首款支援 OAI 標準和液冷的 AI 計算平臺

AIBigbull2050發表於2019-10-08
導語:進一步加速 AI 技術的開放融合

按:近日,在荷蘭阿姆斯特丹舉行的 OCP Regional Summit 2019 大會上,百度與浪潮聯合釋出了全球首款基於 OCP OAI 標準(開放加速器基礎設施)和液冷的 AI 計算新品 X-MAN 4.0。

X-MAN 4.0 是百度超級 AI 計算平臺 X-MAN 系列產品的第四代,浪潮作為百度的重要合作伙伴之一,一直參與 X-MAN 系列產品的研發和生產,並 X-MAN 4.0 作為其目前在超級 AI 計平臺上的最強有力產品推出。

百度釋出全球首款支援 OAI 標準和液冷的 AI 計算平臺

X-MAN 系列,從 1.0 到 4.0

X-MAN 系列是百度用於超大規模 AI 訓練的專用平臺,已在百度的資料中心大規模應用。其中,第一代 X-MAN1.0 首次實現了 AI 計算硬體解耦架構;第二代 X-MAN2.0 首次將冷板式液冷散熱技術應用到 AI 計算產品裡;第三代 X-MAN3.0 則首次提出了模組化標準化設計的理念。

第四代 X-MAN4.0 作為全球首款基於 OCP OAI 標準(開放加速器基礎設施)和液冷的 AI 計算新品,平臺的單節點能夠支援 8 個 AI 加速器。這些加速器之間採用了 8 port HCM(Hybrid Cube Mesh)的互聯架構,雙向通訊頻寬高達 56 GBps,充分保證 AI 加速器的效能。

而在單個機櫃層面,X-MAN4.0 最大可支援 32 個 AI 加速器構建互聯叢集,很好的增強了平臺可擴充套件性。X-MAN4.0 符合 ODCC 3.0 整機櫃規範,高度為 4SU(182.5mm),寬 21 英寸(536.0mm),長度 850mm,支援風冷、液冷散熱方式,並採用了更高效的 48V 供電方式。

百度釋出全球首款支援 OAI 標準和液冷的 AI 計算平臺

百度超級 AI 計算平臺 X-MAN 4.0

OCP 社群與 OAI 標準

OCP(Open Compute Project)即開放計算專案,它是由 Facebook 攜英特爾、Rackspace 等公司於 2011 年成立的一個非營利組織, 目的是與普通的 IT 產業共享更高效的伺服器和資料中心設計。同時,它也是全球雲端計算基礎硬體技術領域覆蓋面最廣、最有影響力的開源組織。

而 OAI(Open Archives Initiative)標準是 OCP 社群裡由百度主導並聯合 Facebook、Microsoft 等針對 AI 硬體加速模組和系統設計所制定的標準。該標準用於指導 AI 硬體加速模組和系統設計, 它集合定義了 AI 硬體加速模組本身、主機板、互聯拓撲、機箱、供電、散熱以及系統管理等一系列設計規範。

目前,OAI 標準也得到了眾多社群成員的支援,包括:Facebook、Microsoft、Google 等網際網路企業,Intel、AMD、高通等 AI 晶片企業,及浪潮、IBM、聯想等系統供應商。

百度釋出全球首款支援 OAI 標準和液冷的 AI 計算平臺

獲得眾多企業成員支援的  OAI 標準

打造全球標準,加速 AI 程式

可以看到,由百度主導的 OAI 標準定義,在一定程度上推動了 AI 新硬體技術全球範圍內的創新與進步。

OAI 標準的推行,不僅能夠直接使得相關廠商統一 AI 硬體加速模組和系統設計,提高多元化 AI 加速晶片相容性;而且還有利於促進不同 AI 加速器技術的開放融合,從而讓 AI 計算平臺設計更加敏捷,產業配套更為簡化。

百度副總裁侯震宇曾表示:“OAI 標準將極大提高不同 AI 硬體加速模組和系統的互操作性,加速新 AI 硬體加速模組的大規模落地應用,全球 AI 硬體生態系統都會從中受益。”這也代表了百度將自身在 AI 領域的最佳實踐共享至國際 AI 社群的初心。

百度釋出全球首款支援 OAI 標準和液冷的 AI 計算平臺



https://www.leiphone.com/news/201909/F41C0T2KYzZAOj2G.html




來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2659011/,如需轉載,請註明出處,否則將追究法律責任。

相關文章