算力頂天地,存力納乾坤:國家超級計算濟南中心的一體兩面

naojiti發表於2022-07-29

提起山東,大家第一時間想到的可能是五嶽之首泰山。《詩經》有云,泰山岩巖,魯邦所瞻,形容的就是泰山令人高山仰止的巍峨。時移事易,到了2022年,以“算賦百業 力導未來”為主題的首屆中國算力大會在山東濟南召開,全國計算領域人士聚在一起,看到的則是一座頂天立地的算力高山——國家超級計算濟南中心,成為新的齊魯地標。

濟南市作為“中國算谷”,國家超級計算濟南中心是其算力支撐機構之一,我國首臺完全採用自主處理器研製的千萬億次超級計算機“神威·藍光”,就誕生於此。

以前,大部分人都很關心算力發展,而國家超級計算濟南中心的實踐說明,資料存力更是算力價值的前提和基礎,發揮算力價值之前,首先要構建“資料存力”。國家超級計算濟南中心不僅是算力巔峰,還是存力標杆,比如目前已經在山河超級計算叢集中落地了分散式儲存創新架構。

20世紀50年代,馮諾伊曼在《101頁報告》中提出了計算機的核心:儲存、計算、控制,奠定了現代計算機的體系結構。從此,算力和存力作為兩大高相關資源,其協同發展成為計算產業繞不開的主題。以新加坡、日本、加拿大等國為例,每1GB儲存空間對應的算力可達1GFlops,存力和算力相對均衡。國家超級計算濟南中心的山河超級計算叢集,能夠提供超850PFlops的算力,總的儲存資源池目前也達到了245PB規模。

如果說算力支撐著千行百業計算需求,那麼存力就是容納吞吐著澎湃算力的乾坤。國家超級計算濟南中心,給了我們一個契機,在東數西算工程正式啟動的元年,去探尋存算協同發展的答案:數字經濟所需要的算力應該由怎樣的存力來承載?而算力與存力的協同發展,究竟能給國家重大科研和經濟發展帶來哪些不可替代的貢獻?

道法自然:頂天立地的超算中心

瞭解國家超級計算濟南中心需要怎樣的存力,首先需要知道它承載了怎樣的計算。

《史記集解》記載,泰山“天高不可及,冀近神靈也”,國家超級計算濟南中心所承擔的計算任務,也有著類似的高水平,主要是解決其他計算機解決不了的挑戰性問題,有著“頂天立地”的作用。

國家科研領域,超算中心服務於國家重大科研需求,主要應用於生物計算、氣候模擬、類腦研究、災害預報、新藥研發、基因研究、航空航天、自動駕駛等領域,這些研究的特徵之一就是資料密集,對於算力的需求十分龐大。以國家超級計算濟南中心的山河超級計算平臺為例:該平臺服務於山東省大科學計劃與大科學工程,為新一代資訊科技、現代海洋、新能源新材料、高階裝備、醫養健康等產業提供算力支撐,要求效能高、算得快。

國計民生領域,超算中心的算力應用涉及國計民生、科技創新,是支撐產業轉型升級的戰略性基礎設施,因此,在滿足國家科研任務對效能的巔峰要求之外,超算中心還要兼顧成本普惠、綠色低功耗等需求,支撐數字經濟浪潮中層出不窮的應用創新與計算需求。國家超級計算濟南中心就有多個計算平臺,承載著關乎國計民生的眾多應用,對區域科研水平提高和數字經濟發展,發揮著重要價值。

從 “頂天立地”的趨勢中不難看出,超算中心已經成為衡量國家綜合實力的標準之一,也是各國科技戰略的必爭之地。以對自然環境和生態的模擬、基礎物理和生命科學等問題求解為己任的國家超級計算中心,自然也需要與之相匹配的儲存能力,包括:底層技術的自主創新、靈活擴充套件的儲存容量、高效吞吐的儲存效率等。

國家超級計算中心作為存力的最佳試驗場,濟南已經率先邁出了探索的步伐。

吐納天地:存力中見數字乾坤

算力作為生產力,支撐社會經濟的數字化轉型升級,而存力作為資料地基,在每一次吐故納新之中,助力數字經濟行穩致遠。資料存力不僅以儲存容量為核心,還包含效能表現、安全可靠、綠色低碳在內的綜合能力。資料存力成為數字經濟背景下,全社會全產業發展的重要指標。

那麼,國家超級計算中心究竟需要怎樣的存力呢?國家超級計算濟南中心總工程師王繼彬在此次大會“以‘數’踐行,創新儲存架構護航超算科技創新”的主題演講中指出,濟南超算率先落地應用了創新的分散式儲存架構,已經有一些經過驗證的關鍵指標:

一、安全可靠。作為國家的戰略性基礎設施,國家超級計算中心的安全可靠有兩層含義,一是底層技術的安全可靠,在新的國際形勢下,國家超級計算濟南中心承載著眾多科研任務,尤其需要儲存領域的原創技術,如材料介質、高效能處理器等的系統創新,守護資料基石;二是日常執行中的安全可靠,要求良好的容災能力,在各類風險,比如自然災害、網路襲擊、人為失誤等情況下,仍然保持業務不斷,資料不丟。

濟南中心所承載的國家對地觀測科學資料中心,每天需要對TB級的實時衛星資料進行集中儲存和計算,過程中不允許中斷,珍貴資料長期儲存不能丟失。濟南超算基於分散式儲存構建的資料儲存系統,能夠做到7*24小時業務不中斷,跨節點保護資料安全,很好地支撐了這一高可靠需求。

二、效能表現。大科學領域HPC應用對存力的容量和效率提出了更高要求,一方面,科學計算的資料規模龐大,需要的儲存容量也越大,1臺基因測序儀每年產生的資料可達8.5PB,需要超前規劃、靈活擴容,比如濟南超算的山河超級計算平臺,作為服務山東省大科學計劃與大科學工程的重大科學裝置,總儲存資源池就達到了245PB;另一方面,科學計算的存算資料互動頻繁,計算任務長,應用負載多元化,訪存空間不規則,對儲存系統的吞吐效能要求很高。因此,濟南超算與華為合作,基於華為OceanStor Pacific分散式高效能並行儲存,實現了業內1.3倍的效能提升,在IO500 10節點打榜中獲得全球第一的榜單成績。資料存得下、流得動,是存力的基礎指標,為科學計算發揮支撐作用。

三、統一管理。隨著資料應用場景增多、AI技術的成熟,智慧計算、雲平臺等新業務成為主流,因此需要多個計算平臺針對不同應用輸出不同算力。面對異構計算和多樣化應用,傳統超算中心多個計算叢集部署多套儲存的方式容易遭遇瓶頸,比如海量資料在不同的資源池中,會形成資料孤島,給協同分析、價值挖掘帶來阻礙。因此,濟南超算基於分散式儲存,構建了統一資料底座,率先打造出山東省超算互聯資料一張圖。透過全域性統一的資料檢視和管理策略,實現不同叢集之間的多協議互通,讓資料能夠跨域、跨叢集、跨裝置共享與流動,從而助力科學計算的資料價值挖掘與協同分析,加速科技創新。比如山河超級計算平臺,就實現了檔案、物件和大資料融合儲存以及資料的跨域流動。

基於分散式儲存創新架構,國家超級計算濟南中心聯合合作伙伴,完成了一系列關於存力的實踐探索,展現出存力與科學計算、數字經濟相結合的意義。可以肯定的是,超算中心的頂天立地,靠的不是算力的一枝獨秀,而是算力與存力的協同發展。

築基未來:雙輪驅動使能數字經濟

聽起來,超算中心主要服務於高精尖科研,那麼濟南超算的存力實踐,對普通人來說有意義嗎?中國有句話叫“已識乾坤大,猶憐草木青”,存力不僅能包羅容納科學世界的壯闊,同樣也是支撐著每一個人、每一個企業、每一座城市的數字底座,隨著數字經濟的騰飛,滋養我們習以為常的日常生活、一草一木。

舉個例子,大家應該都瞭解“東數西算”工程的價值,全國算力一張網的逐漸落成,將切實帶來產業升級、生活提升、經濟發展,讓東西部居民都為之受益。而濟南超算的分散式儲存架構創新實踐,對於方興未艾的東數西算工程就有著極為重要的參考意義。

我們知道,“東數西算”工程旨在構建一個集資料中心、雲端計算和大資料於一體的新型國家計算網路,這張算力資源網路的本質是以數載算,透過資料流通、分析和消費,讓算力轉化為GDP產值和社會民生的最佳化。而資料能否存得下、存得好、流得動、高能效,都取決於存力。

而東西部資料中心間的資料流動,就有一系列問題是需要透過存力提升來解決的:

比如前面提到濟南超算不同計算叢集中的資料孤島問題,在東西部的資料流動時也同樣存在。透過分散式儲存,實現跨域資料安全高效流動和共享,能夠提高東西部的資料利用率和協同效率,讓算力更充分地發揮GDP帶動作用。

再比如,全國算力一張網形成之後,資料卻是散落在各處的,如果沒有跨地域統一的後設資料管理,則無法支撐東西部並行分析,資料儲存能效比不高,算力基礎設施也就無法取得最大效益。這時候濟南超算所落地的統一後設資料管理等經驗,存力一張網結合算力一張網等技術,將使得管理效率大大提升。

存力和算力,是數字經濟高質量發展的一體兩面,隨著超算網際網路和“東數西算”工程的持續推進,存力升級必將成為數字基礎設施的演進方向。

國家超級計算濟南中心率先開啟錦囊,進入了資料驅動第四正規化的全新階段。不難發現,無論高精尖的科研創新,還是接地氣的民生福祉,都藏在存力這個吐納天地的“乾坤袋”中。

接下來,我們將看到中國科技在算力與存力的雙輪驅動下,不斷鼎革天地。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2908261/,如需轉載,請註明出處,否則將追究法律責任。

相關文章