中國“超算”超越:從千萬億次到百億億次——中國超級計算機回眸與前瞻

楊靜lillian發表於2014-05-20

超級計算機是大國綜合實力的象徵,也是確保國家競爭優勢的重要保證。在科學技術飛速發展的今天,超級計算機已成為大國重器之一。

據悉,目前世界排名首位的我國“天河2號”超級計算機,預計到2015年底峰值速度將升級到每秒10億億次以上。而同樣由國防科技大學研發、誕生於2009年10月29日的“天河1號”,是我國首臺峰值千萬億次的超級計算機。這樣,從“天河1號”的千萬億次到“天河2號”的十億億次,天河系列超級計算機的峰值速度在6年內將提升100倍,提高兩個量級。

超級計算的中國道路

在計算機產業發展中,有個著名的摩爾定律,積體電路IC上可容納的電晶體數目,約每隔18個月便會增加一倍,效能也會提升一倍,這一定律揭示了資訊科技進步的速度。但為什麼超級計算機的發展速度比摩爾定律還要快這麼多呢?帶著這一問題,筆者採訪了中國計算機學會高效能運算專業委員會祕書長、中科院計算所張雲泉研究員。張雲泉研究員解釋道:超級計算機的效能實際上是10年翻1000倍!而超級計算機之所以有超越摩爾定律的發展速度,是因為超級計算機一方面以計算機技術的摩爾定律為基礎提升速度,另一方面又通過採用大量處理器的並行體系架構進行橫向擴充套件,通過平行計算獲得更多的效能提升。所以,超級計算機的效能服從於10年翻1000倍的超級定律,其發展完全可以用一日千里來形容。

追根溯源,美國的超級計算機發展,始於上世紀40年代的曼哈頓計劃,由於超級計算機在核能、軍事、原子彈和生命科學等國家戰略命脈上起到的關鍵推動作用,在美國、日本等國家,超級計算的早期發展也一直是採用舉國體制進行投資研製。

如今,超級計算機已成為衡量一國科技綜合實力的標誌,在諸如天氣預報、基因工程、核工業、軍事、天體物理模擬、航空航天等高科技領域大展身手。據張雲泉研究員介紹,中國超級計算機的發展歷程,雖然比美歐日等已開發國家短,但從21世紀在國際舞臺上驚豔亮相以來,樹立了一個又一個里程碑。例如2004年,曙光4000A位列世界十大超級計算機,中國高效能運算機首次進入世界前十;2009年,“天河1號”是世界上首次採用CPU加GPU的異構加速體系結構設計出的千萬億次超級計算機;2010年11月,由國防科大設計的“天河1A”首次為中國奪得世界TOP500排行榜的第一名;2011年神威藍光第一次全部採用國產CPU和國產水冷技術研製出千萬億次超級計算機;2013年“天河2號”又以峰值計算速度每秒5.49億億次連續兩次奪得世界第一等。

中國近年來在超級計算機領域的連續突破引起了美國的強烈關注。超級計算機領域的大國競爭是雙方經濟實力、計算機領域科研能力、高效能運算機保有量及其應用水平的綜合較量。美國一些高效能運算學術研究機構估計中國在超級計算機領域和美國的差距是10年以上,這是對中國使用商用和國產技術的公開資訊評估的結果,但科技創新的發展有時會是指數性的,很難預料。張雲泉研究員分析,經過多年的努力,中國與美國在超級計算機的發展水平上,綜合差距應該還在十年以上。其中超級計算機硬體系統的研製水平雙方互有伯仲,差距不大甚至中國能夠偶爾趕超,但在軟體系統設計和應用軟體的研製及推廣方面的差距則在十年以上。此外,歐洲在超級計算機的應用方面水平很高,但缺乏製造超級計算機裝置的競爭力。日本在超級計算機大國競賽方面的競爭優勢主要體現在應用方面,其超級計算機硬體系統的研製水平在逐漸被中國趕超。

根據世界超級計算機TOP500排行榜和中國高效能運算機TOP100排行榜的資料綜合來看,截至2013年11月,國防科大研製的“天河2號”仍是世界上效能最強大的超級計算機。該系統是中國國防科技大學與資訊科技製造企業浪潮集團合作的產物。它採用了數萬枚英特爾公司的“至強”多核處理器和“至強”Phil眾核協處理器及數千顆國產FT-1500多核處理單元,與此同時,國防科大還開發了其使用的高速網際網路絡和麒麟Linux作業系統。

據英特爾公司技術計算高階架構師何萬青博士介紹,“天河2號”超級計算機建造服務於公共事業,在硬體速度上已經是全球第一,在此基礎之上,國內的主要研發工作已轉移到大規模並行軟體的開發和實際應用推廣方面。英特爾公司在全球範圍內長期支援超級計算機的設計和建設,高效能運算也是其重要的技術高地。在“天河1號”和“天河2號”的開發過程中,英特爾中國公司配備了專業團隊為使用者提供產品技術支援。

正因為超級計算能力已經成為評價一個國家綜合國力的標準之一,也是中國自主創新實力的一種展現,因此我國對超級計算的投入也十分巨大,取得了舉世矚目的成果。

超級計算的中國創新

由於從上個世紀80年代開始,美國等西方國家就對中國進口美國的超級計算機實施一定效能水平的禁運和關鍵技術的封鎖,中國的研發機構不得不依靠自己的研究力量攻堅克難。近年來,我國的中科院計算所、國防科技大學和江南計算技術研究所分別在超級計算的產業化和自主創新方面走出了自己的特色之路。

曙光公司是一家在中科院計算所支援下,以國家863計劃重大科研成果為基礎組建的國家高新技術企業。2010年,由曙光公司研發的“星雲”高效能運算機以每秒系統峰值達三千萬億次的速度,首次為中國取得了全球第二的成績,向國人力證了“中國速度”。2014年,曙光公司即將迎來IPO上市的輝煌時刻,走出了一條國產高效能運算技術產業化的成功之路。

國防科技大學經過多年積累在超級計算機的網際網路絡技術上逐漸擁有了自主智慧財產權併成功應用在“天河1A”和“天河2號”系列超級計算機上,其重要性對超級計算機的體系結構可擴充套件性設計而言是居於首位的。在計算部分,雖然中央處理器大量採用了英特爾晶片,但其中的FT-1500多核處理單元則為國產。在系統整合與散熱製冷以及系統軟體等方面,“天河2號”基本使用了自主創新的技術。綜上所述,“天河2號”的自主創新比例已經達到60%以上,有些輿論說中國的超級計算機是美國晶片的大量組裝和簡單堆疊,這種論調是非常荒謬的。

再以神威藍光超級計算機為例,該機獲得科技部863計劃支援,由國家平行計算機工程技術研究中心製造,於2011年9月安裝於國家超算濟南中心,全部採用自主設計的16核CPU,系統總功耗只有不到1兆瓦 ,這也使得中國成為繼美國、日本之後第三個能夠採用自主CPU構建千萬億次超級計算機的國家。此外,神威藍光的另一個優勢是整合度高、噪音低、水冷散熱高效,其自主創新的比例高達80%以上。

中國超級計算機的自主創新從整合開始,到系統設計、主機板製造,最後再到CPU設計、系統軟體設計,自主創新的速度很快。中國的超級計算機不僅是自主創新的產物,也是中國其他戰略重點行業進行自主創新的基礎設施。超級計算機可用於公共事業、科研平臺,其強大的計算能力與資訊服務能力是中國創造研發的重大支撐。作為“現代科學技術的大腦”,超級計算機廣泛應用於地球氣候模擬、宇宙天體研究、基因研究、石油勘探、自然災害預報等“高、精、尖”的前沿領域,已成為世界各國競相爭奪的科技戰略制高點。而即將到來的大資料時代,更是對人類的資料駕馭能力提出了全新的挑戰,運用超級計算機解決大資料時代的重大問題迫在眉睫。資料顯示,“天河1號”為汽車裝備、石油物探、動漫渲染、生物醫藥等相關企業帶來上億元效益,輻射區域和行業經濟規模近百億元。

但不可否認,我國在超級計算機的軟體開發與應用方面與美歐日等已開發國家還存在不小的差距。以至於美國有關機構認為中國的超級計算機目前還主要是一種國家創新成果的展示,對美國的領先地位還不構成真正威脅。他們認為,只有中國的超級計算機應用拿到以“超級計算領域的諾貝爾獎 ”著稱的戈登·貝爾獎,才能證明中國的超級計算髮展真正具備了與美國抗衡的實力。也只有到那時,美國才會真正拉起警報:中國已經不再是“大而不強”的超級計算大國,而確實成為要趕超美國的超級計算強國了。

美國未真正重視中國在超級計算領域的挑戰,主要原因在於超算軟體與應用對於超級計算機發展而言,與整個硬體系統的設計製造同等重要。而由於軟體需要建模、實驗、引數調整等長期的工業及研究積累,我國對此重視不足,以至長期欠賬。重硬體、輕軟體,重製造、輕應用的結果,造成中國超級計算的科研等應用比較薄弱。

據何萬青博士介紹,高效能運算軟體在國內的使用者分佈涵蓋了科學院系統、各大學計算機系、各超級計算中心、中石油、中石化、氣象局和影視新媒體等諸多使用計算叢集進行科學計算的單位。但與美國相比,中國國內高效能運算的應用還有很大發展潛力。

“天河2號”所在的廣州超算中心已經與世界領先的基因公司華大基因展開基於基因科學的合作內容,將醫療與基因工程整合化、個性化。華大基因公司的陳鋼研究員介紹,生命科學領域的重大科研專案已經離不開大規模的計算資源。他形象地比喻道:我國的超算技術,尤其是硬體技術的發展,取得了舉世矚目的成就,但配套的網路資源、技術支援就顯得有些滯後。石油勘探是用車拉著硬碟去超算中心用國外的商業軟體跑分析;基因測序是一趟趟地快遞硬碟。在美國,亞馬遜的雲端計算服務為客戶提供了Direct Connect服務,可以搭建起客戶到資料中心的專線連線,用於傳輸資料。而在國內,由於價格、手續、法規方面的問題,一般的使用者要專線接入超算中心還是很麻煩的事情。這就限制了超算在諸如生命科學等諸多大資料領域的應用。

超級計算的中國夢想

據有關專家預測,“天河2號”的世界第一位置還能保持到今年年底。而緊接著的2015年,預計“天河2號”的峰值速度將再次升級到10億億次以上,那麼,10億億次以後,中國的超級計算還將走向何處?

張雲泉研究員認為:雖然超級計算機的發展速度超越了摩爾定律,但在5年之後也許會遇到技術瓶頸——也就是說,預期到2020年E級超級計算機的誕生可能不得不推遲。E級超級計算機是指每秒可進行百億億次數學運算的超級計算機,其運算速度比2015年建成的10億億次超算還要快10倍,被全世界公認為超級計算機界的下一頂皇冠。之所以會存在難以克服的障礙,主要是因為美國的科學家對未來E級超級計算機的設計建造設定了新的功耗和成本標準——按照這個標準,E級計算機的整體功耗不能超過20兆瓦,整機預算不能超過兩億美元,而從目前的技術儲備來看這是不可能達到的標準。中國雖然還未對E級超級計算機建造設定此類標準,但如果想讓製造出來的E級超級計算機獲得國際認可,恐怕也不得不遵循這一行規。

有些高效能運算專家則傾向於認為晶片技術的發展是決定性因素,如果處理器不能突破奈米極限,甚至摩爾定律到2015年前後遭遇終止,那麼超級計算機的下一步發展就會遇到障礙。但如果晶片技術、計算技術有新的突破點,例如認知計算、神經網路晶片、量子計算的發展有質的飛躍,或者晶片的奈米極限得到有效突破。那麼,超級計算機的發展將迎來又一片海闊天空。

如此看來,超級計算的中國夢想,還不僅依賴於中國科研人員與企業界的自主創新,更與國際計算機領域的前沿進展息息相關。E級計算,也是全人類的共同夢想。

(本文首發在中國科技網。)

相關文章