HPE與美國能源部共建新超算,基於ARM架構

HitTwice發表於2018-06-25

在幾周前,美國能源部正式公佈了其新一代超級計算機——“Summit”,這個訊息想必大家都已有所耳聞。據稱,其運算效能可達到200PFlops,合作伙伴是IBM和英偉達。

美國今年在超級計算機方面的動作不止一個Summit。據外媒報導,本週早些時候,HPE和美國能源部宣佈將安裝一臺名為Astra的超級計算機,可能最早會在今年夏天結束時完成,雖然無法確定具體時間,但可以肯定的是在今年年底之前。

該系統將被美國國家核安全管理局用於執行建模和模擬工作負載,以解決國家安全、能源和科學等問題。

美能源部與HPE共建新超算,基於ARM架構

Astra將成為目前世界上最強大的基於ARM的超級計算機

Astra的理論運算效能峰值可達到2.3PFlops,跟Summit與我國的神威·太湖之光(93.9PFlops)比起來,前者的效能確實有點不夠看,但它也有自己的獨到之處。

“它不是世界上最強大的超級計算機,但它是迄今為止最大的基於ARM的計算機。”HPE高階技術集團的副總裁Mike Vildibill在一次採訪中表示,“(在全球超級計算機排行中)它仍然在前100名,這是一個非凡的里程碑。據我所知,目前全球超算TOP500中還沒有基於ARM的系統,從這我們也能看出美國能源部在將這種新架構帶進他們的生產環境方面有多麼積極。”

該系統基於HPE的Apollo 70系統,2U空間,每個包含四臺伺服器,每臺伺服器分別使用兩個Cavium ThunderX2片上系統。總而言之,該系統將使用5184個CPU來部署2592個伺服器,所有這些伺服器都使用InfiniBand進行高頻寬互連。

ThunderX2處理器是幾個月前才釋出的一個相對較新的產品,選擇它的一個原因是其記憶體效能高。HPE聲稱,該系統將提供比具有更高系統密度的傳統系統高出33%的記憶體效能。記憶體效能很重要,因為它增強了系統執行超算工作負載的能力。

Astra將使用Lustre檔案系統,這是一種並行檔案系統,通過同步的、協調的輸入/輸出操作(IOPS)提供高效能訪問能力。在儲存方面,Astra將部署20個全快閃記憶體HPE Apollo 4520,連線到一個容量超過400 TB的單一檔案系統上。

Astra系統的功率將達到1.2兆瓦,將使用HPE的MCS 300進行液體冷卻,這是一種液體冷卻解決方案,安裝在Apollo 70機架上。

Vildibill還提出,使用ARM處理器的決定是美國能源部在開始尋找合作伙伴來設計和建造這個系統之前做出的,這表明,美國能源部的這個專案就是衝著ARM去的。

如上面所說,在全球頂尖的超級計算機運算效能達到百級PFlops的當下,Astra的表現並不算亮眼,但它“ARM系最強超級計算機”的身份不可謂不特別,而ARM架構在超算領域的潛力也有待挖掘。

拋開競爭關係,美國能源部積極使用新架構來滿足不同生產環境的需求的這一做法是值得肯定的。其實對超級計算機進行排名,更多為了讓我們能夠更好地認識這些“國之重器”,建設超級計算機耗資巨大,不能只為爭一口氣,要從實際情況出發。當然,對運算效能的追求也理應是無窮無盡的。

特別值得一提的是,我國的下一代超級計算機——“天河三號”也在研製中,這是我國新一代百億億次超級計算機(又稱“E級超算”),它採用了自主CPU、自主作業系統和自主互聯通訊,可以說是自主程度最高的我國超級計算機;從目前的進展情況來看,“天河三號”有望在2020年研製成功。到時,在研究人員的努力下,它將能發揮自身的最大價值。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31473948/viewspace-2156626/,如需轉載,請註明出處,否則將追究法律責任。

相關文章