天河二號:中國的超級計算機及其超級應用

楊靜lillian發表於2014-05-14

注:本文綜合《參考訊息》和《南方日報》的近日報導及本人近期對英特爾公司資料中心事業部技術計算高階架構師何萬青博士的訪談彙編而成。

enter image description here

據美國《大眾科學》月刊網站5月5日報導,日前,“天河二號”超級計算機開始向公共使用者提供計算服務,與此同時其系統繼續進行除錯和微調。“天河二號”坐落在廣州中山大學的國家超級計算機中心裡,該計算機擁有312萬核心,以及從1.6萬個計算節點中獲得的每秒3.39億億次浮點運算的峰值處理速度,其理論峰值處理速度則是每秒5.49億億次浮點運算。緊隨其後的競爭者是美國橡樹嶺國家實驗室的“泰坦”超級計算機。“泰坦”的運算能力為每秒1.76億億次浮點運算,僅為“天河二號”的一半左右。

兩臺超級計算機都對以科研為目的的公共使用開放,包括分子物理學、氣候模擬及天文學訊號處理等。當然,這兩臺超級計算機背後的技術也可用於軍事目的,包括核武器試驗模擬和密碼回譯等。

據行業調查機構TOP500稱,截至2013年11月,“天河二號”仍是世界上功能最強大的超級計算機。該系統是中國國防科技大學與資訊科技製造企業浪潮集團合作的產物。它採用了數萬枚英特爾公司的“至強”中央處理器和中國國產的FT-1500核心處理單元,與此同時國防科大則開發了其使用的麒麟Linux作業系統。值得注意(而且與世界各地眾多資訊科技和防務專案不同)的是,“天河二號”是在2013年12月投入執行的,這比原計劃的2015年提前了很多,而且據說其造價只有3.9億美元。

鑑於其前所未有的處理能力,中國科學家仍在為“天河二號”找到新的用途和使命獻計獻策。“天河二號”是中國自上世紀80年代開始的863科技計劃的成果,該計劃的目的是加速在材料科學、資訊科技和航空等領域的研究。863計劃的其他成果包括世界205臺速度最快超級計算機中的62臺、反衛星鐳射器及可再生能源等。

超級計算

1946年2月14日,這是人類歷史上劃時代的一天。世界上第一臺電子計算機“埃尼阿克”在美國賓夕法尼亞大學的實驗室裡誕生。“埃尼阿克”著實是個龐然大物,它由17468個電子管、6萬個電阻器、1萬個電容器和6000個開關組成,重達30噸,佔地160平方米,耗電174千瓦/時,耗資45萬美元,每秒能執行5000次加法運算。

超級計算機(supercomputer),通常是指由數百數千甚至更多的處理器(機)組成的,能夠執行一般個人電腦和伺服器無法處理的大資訊量高速運算的計算機。如果把普通計算機的運算速度比做成人走路,那麼超級計算機就達到了火箭的速度。在極高的運算速度下,人們可以通過數值模擬來預測和解釋以前無法實驗的自然現象。就拿“天河二號”來說,13億人用計算器算1000年才能達到“天河二號”1小時的計算量。

由於超級計算機的基本組成元件與個人電腦的概念無太大差異,所以很多人會誤以為超級計算機就是簡單的CPU疊加。但這是一個認識誤區。浪潮集團高效能伺服器和儲存技術國家重點實驗室副主任胡雷鈞打了個比方:你用1000臺PC,用普通的網線把它們連線在一起,你可能花了1萬度電,算了10天,但是你用真正的超級計算機,可能只用5000度電,花了兩天就算出來了。

超級計算機做的所有工作都是在提高效能和效率。在資訊爆炸和科學不斷進步的時代裡,要推動一個領域繼續向前發展,超級計算機的存在必不可少。如今,超級計算機也成為衡量一國科技實力的標誌,在諸如天氣預報、基因工程、核工業、軍事、天體物理模擬、航空航天等高科技領域大展身手。

從1983年我國第一臺被命名為“銀河”的億次巨型電子計算機誕生,到2013年“天河二號”以峰值計算速度每秒5.49億億次再度奪冠,可以說,中國人用30年實現了超算趕超的大跨越。

enter image description here

不過,雖然“天河二號”成功突圍,但在整體實力上,中國與超級計算機第一大國美國相比還有不小的差距。《人民日報》2014年1月的統計資料顯示,單論超級計算機的數量,美國擁有全球500強超級計算機中的253個,總數較其他國家和地區的總和還要多,優勢明顯。中國大陸共有65個超級計算機進入500強榜單,位居第二。日本以30個位列第三。英、法、德國分別以29個、23個和19個位列第四至第六位。

據英特爾公司資料中心事業部技術計算高階架構師何萬青博士介紹,美國一些高效能學術機構對目前中美之間超級計算機領域的差距的估計是10年左右,這是對中國使用商用和國產技術的公開資訊評估的結果,實際上對中國是比較樂觀的估計,但是技術的發展有時會是指數性的,很難預料。“天河二號”超級計算機的建造服務於公共事業,在硬體速度上已經是全球第一,中國的差距主要體現在軟體和應用方面。日本前幾年也開發出“京”超級計算機,一度佔據全球500強超級計算機榜首,但美國判斷日本經濟發展趨緩,未來在超級計算機領域可能沒有領導企圖。英特爾公司在全球範圍內長期支援超級計算機的設計和建設,高效能運算也是英特爾公司的重要技術高地和利潤增長點。在“天河一號”和“天河二號”的開發過程中,英特爾中國公司都配備了專業團隊為使用者提供產品技術支援和軟體效能優化等服務。

超級應用

隨著超級計算機的不斷髮展,它所延伸的領域大多已與民生息息相關,例如與人們生活密切相關的天氣預報和氣候模擬、地震預報、三維地圖以及大資料等應用。

作為“現代科學技術的大腦”,超級計算機廣泛應用於地球氣候模擬、宇宙天體研究、基因研究、石油勘探、自然災害預報等高、精、尖的前沿領域,已成為世界各國競相爭奪的科技戰略制高點。

而即將到來的大資料時代,更是對人類的資料駕馭能力提出了全新的挑戰,運用超級計算機解決大資料時代的重大問題迫在眉睫。

據何萬青博士介紹,英特爾中國公司的高效能運算軟體在國內的使用者分佈涵蓋了科學院系統、各大學計算機系、各超級計算中心、中石油、中石化、氣象局和影視新媒體等諸多使用計算叢集進行科學計算的單位。

我國走在世界前沿的石油勘探超算應用,其發展經歷過一段艱苦的時期。中國石油集團東方地球物理公司研發中心首席工程師趙長海對此感受頗深,他說:“所謂上天容易入地難,說的就是石油勘探。”

在青海柴達木盆地,海拔4000米的英雄嶺地區地質條件惡劣,地震地質條件使得該地區地震勘探久攻不克。趙長海說:“石油勘探,我們看不見油,最直接的方式就是打孔,但打孔成本太高,要靠人工地震波進行探測,再進行資料分析。這種計算,不管是硬體還是軟體,負荷都是非常龐大的。”

所謂的人工地震波探測,也叫地震勘探,就是向地下發射一個地震波,地震波發射之後地面有接收器,接收完這些地震波之後再進行分析,從而確定石油的位置。但是要接收並分析這些地震波,不僅要有瞬時獲取大量資料的能力,而且還涉及許多複雜的計算。

最後,藉助超級計算機的不斷髮展,龐大的石油勘探地震資料計算才成為可能。

除了石油勘探,超級計算機在智慧城市、個性化醫療、天體物理等方面也有著廣泛的應用前景。有專家大膽預言,藉助於超級計算機強大而快速的運算能力,在實驗室就能實施亞臨界核試驗,其與真正核試爆的效果是相同的,這意味著超級計算完全可以取代核試驗。

儘管如此,由於早期的超級計算機大量應用於國家級的科研專案,讓公眾對超級計算機還十分陌生,造成一個超級計算機跟自己的生活關係不大的印象。但實際上,隨著超級計算機的不斷髮展,它所延伸的領域大多已與民生息息相關。

資料顯示,“天河一號”為汽車裝備、石油物探、動漫渲染、生物醫藥等相關企業帶來上億元效益,輻射區域和行業經濟規模近百億元。

就拿天氣預報來說,人們都關心第二天出行的天氣狀況,但是天氣情況的預測為什麼需要超級計算機呢?

氣象局專家介紹,目前的中短期天氣預報主要是根據氣象衛星等觀測的大氣實況資料,通過求解描述天氣演變過程的動力學方程組實現的。這種運算涉及資料量龐大,運算過程複雜,一般的計算機要計算出第二天的天氣情況可能需要幾個月的時間,這種預報就失去了意義。也就是說,超級計算機可以幫助我們實時地掌握自己附近地區的天氣情況,不再感嘆“六月的天,孩子的臉”或者“東邊日出西邊雨”了。

儘管超級計算機的執行速度越來越快,但它也面臨著瓶頸:體積越來越大,產生的熱量越來越多,耗電量也越來越大。

“如果僅僅是算得更快,但耗電量更大、成本更高,就失去了應用意義。”浪潮集團高效能運算總經理劉軍說,現在超級計算機的研究方向是不斷提升價效比,在額定功耗下儘可能提升運算速度。

這時,超算演算法的意義就不言而喻。通俗地說,超算演算法的意義在於,找出更高效率的計算方法,最大限度地充分利用超級計算機的計算能力,這是對人們體力、腦力和基礎知識的考驗。

相比超級計算機硬體的快速發展,目前全世界更看重超算應用領域的研究。但據浪潮集團劉軍介紹,雖然中國擁有世界最快的超級計算機“天河二號”,但我國在超算應用領域還十分薄弱,九成以上的超算軟體都依賴國外進口。這也導致我國雖然擁有效能很強的大型超算系統,卻缺乏相匹配的大規模並行軟體,很多大型超級計算機不得不拆分成小規模的叢集來跑應用,大系統並沒有發揮出應有的價值,“這實在是一種很大的浪費”。

“目前,我國在應用軟體上能跑到萬億次以上的不是非常多,也就是說超級計算機的利用率並不高。超級計算機的使用要非常謹慎,用不好就是燒錢的。”高效能伺服器和儲存技術國家重點實驗室主任、浪潮集團執行總裁王恩東也告訴《南方日報》記者,如何把超算用好是全球性問題,要想讓超級計算機真正成為推動科學技術創新和社會經濟發展的“發動機”,必須要從應用創新和人才培養入手,充分發揮硬體的計算潛力。

相關文章