探秘“啟明”“太乙” 走進南科大超算中心

陶然陶然發表於2021-05-11

  【IT168 現場報導】ASC20-21現場總決賽於5月8日-12日在南方科技大學舉行。

  21支中國大陸參賽隊設計和搭建超算叢集、最佳化指定應用、參加英文答辯,角逐冠亞軍、最高計算效能獎、e Prize計算挑戰獎等諸項大獎。同期7支來自中國大陸之外的隊伍透過線上比賽的方式參與總決賽比拼。

   在總決賽期間,筆者有幸參觀了南方科技大學科學與工程計算中心,帶大家去揭開兩套高效能叢集“啟明”和“太乙”的神秘面紗。

  科學與工程計算中心(以下簡稱:計算中心)於2018年10月全校發文成立。首任計算中心主任由美國物理學會會士(APS Fellow),南科大力學與航空航天系講席教授王連平擔任;副主任由美國電子電氣工程師協會會士(IEEE Fellow),南科大電腦科學與工程系講席教授史玉回擔任。

  計算中心是南科大四大公共科研平臺之一,主要任務是大力發展和有效管理南方科技大學高效能運算和大資料分析裝置,使學校超算叢集達到國內大學領先水平,並逐步接近和達到國際一流;彙總學校在高效能運算研究方面取得的成果,鼓勵教授們共同探討超算和大資料分析等前沿學科,組織相關學術研討會;收集分析和協調校內各單位在計算和大資料分析上的需求;為學校培訓高效能運算後備人才。

  目前中心擁有兩套高效能叢集,叢集分兩期建設,一期叢集(啟明,Qi-Ming)包含230個雙路刀片節點,7個大記憶體計算節點和6個GPU節點, Lustre並行檔案儲存系統,Mellanox EDR高速(100 Gbps IB)計算網路。啟明系統峰值超過300萬億次(其中GPU系統峰值為44萬億次)。

  二期叢集(太乙,Tai-Yi)包含815個雙路刀片節點,2個大記憶體節點和4個GPU節點,GPFS並行檔案儲存系統,Intel Omni-Path高速(100 Gbps OPA)計算網路。太乙系統理論計算峰值超過2500萬億次,實測計算效能超過1687萬億次。在2018年11月的全球Top500中排名第127,最新一期(2020年11月)的排名為319。

  浪潮具備大型超算系統的構建和運營經驗,並提出高效能高可靠的軟硬體一體化解決方案,在此基礎上為使用者按需定製專業應用軟體,重視使用者的應用需求。

  據介紹,南方科技大學科學與工程計算中心還擁有超算俱樂部。科大超算俱樂部,由學生超算團隊,不斷壯大發展而來,不斷取得突破,為校爭取了眾多榮譽。 在ASC19世界大學生超級計算機競賽總決賽上,南科大學生超算團隊就獲得了大賽一等獎、應用創新獎及最佳人氣獎三個獎項。

  南科大計劃將超算俱樂部建設成高效能運算人才培養,催化科研程式的重要陣地,透過校企合作,南科大希望能夠為學生提供豐富的實習就業機會,成為高效能運算人才的搖籃。

  明天(5月12日)下午,ASC20-21總決賽閉幕式暨頒獎儀式將隆重舉行,這些辛苦了四天的參賽隊員們,將迎來屬於他們的高光時刻。那麼,明天又會給我們帶來哪些精彩的故事呢?讓我們拭目以待!IT168將對本次大賽進行全程報導,瞭解大賽更多資訊,請持續關注: http://zt.itpub.net/topic/ASC2021/

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2771846/,如需轉載,請註明出處,否則將追究法律責任。

相關文章