Tesla™ GPU高效能運算應用案例

洛欣發表於2010-12-23
英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)在醫學上的應用

  Techniscan是一家開發自動化超聲波成像系統的公司,該公司已經將其專利技術演算法從基於傳統CPU系統移植到了CUDA™以及英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)上。基於CUDA™的系統在不到20分鐘內即可完成Techniscan演算法的處理,而從前的系統則需要花費長達3倍的時間。在短時間內快速生成高度精細影像的能力在乳腺癌掃描領域中尤為重要。一旦這種檢驗裝置通過了美國食品及藥物管理局(FDA)的許可,患者將能夠在一次就診期間內拿到檢驗結果。如需瞭解更多資訊,敬請訪問www.techniscan.com。

  英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)在金融上的應用

  Hanweck Associates是一家專門從事投資與風險管理的金融服務公司,該公司需要向其客戶提供一種能夠實時重新計算期權的方法。 Hanweck通過其Volera系列高效能期權分析產品來解決這一難題。 Volera僅使用了12個支援CUDA™的GPU(圖形處理器)即可實時分析全美的股票期權市場。這項工作此前一度需要60多臺常規伺服器才能完成。 憑藉CUDA™,Hanweck的客戶能夠更快地將當今瞬息萬變的市場看得更加透徹,同時能夠在功耗、硬體成本以及資料中心地產等方面節省鉅額成本。如需瞭解更多資訊,敬請訪問: www.hanweckassoc.com。

  英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)在能源上的應用

  近年來,隨著油氣勘探變得越來越複雜、成本越來越高,為了更準確地評估地表下岩層的狀況,並確定地層地質結構,地震成像公司開始探索全新的相關技術。疊前時間偏移(PSTM)就是此類新型地震成像技術之一,但是這種技術需要大規模的計算量,從前,這種大規模計算意味著購置與運營成本非常高昂。吉星吉達科技有限公司(GeoStar)是專門致力於這一領域的一家領先的中國地球物理服務供應商,該公司正在尋求既能執行復雜地震演算法又能降低成本與功耗的方法。

  為解決這一難題,吉星吉達與英偉達™(NVIDIA®)共同推出了一款基於英偉達™(NVIDIA®) Tesla GPU(圖形處理器)的全新硬體與軟體解決方案。近幾個月以來,中國科學院(CAS)地質與地球物理研究所一直在測試搭配了吉星吉達解決方案的英偉達™(NVIDIA®) Tesla GPU(圖形處理器)。在計算方圓740平方公里的疊前時間偏移資料時,與傳統的66顆CPU(核心時脈頻率3.4GHz)群集相比,24顆Tesla GPU(圖形處理器)的處理速度提升了600倍以上。中科院研究人員認為通過進一步調整,還可以達到更快的速度。這意味著使用者不僅可以實現效能的大幅提升,而且還能夠在系統執行與散熱的耗電成本上節省大筆開支。

  與傳統CPU群集相比,英偉達™(NVIDIA®)與吉星吉達能夠以更低的成本在PSTM運算上實現100400倍速度提升,同時將功耗降低95%。

  吉星吉達科技有限公司總經理劉欽表示:“對油氣勘探行業來說,這是一款革命性的解決方案。基於CUDA™架構的英偉達™(NVIDIA®) Tesla™高效能運算解決方案徹底顛覆了油氣勘探地震資料處理的固有方式,可以節省大量成本。”

  目前,由英偉達™(NVIDIA®)與GeoStar公司共同開發的解決方案得到中國國內石油天然氣行業企業的廣泛認可,並已開始用於大慶、勝利、吐哈等油田的勘探專案。

  英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)在三維影像重構上的應用

  過程工業是以物質和能量的轉化為核心的基礎產業門類,包括了化工、冶金、鋼鐵、能源和環保等影響國計民生的重要行業,目前佔中國GDP的近1/6。但這些產業也面臨著能耗和資源消耗量大、汙染嚴重等嚴峻的挑戰。探索和引領優化工藝流程的新技術,提升生產效率和產品附加值,正日益成為這些行業競爭的焦點之一。計算機模擬技術在此大有用武之地,而模擬物件的複雜性決定了它對超級計算的迫切需求。而基於CPU的傳統超級計算裝置購置成本高,實驗週期長,使企業既有成本壓力帶來的顧慮,又難以適應快速變幻的市場節奏,極大地限制了模擬技術在過程工程中的應用。寶鋼、中石化、中石油等中國過程工業的龍頭企業一直致力於探索與應用既能實現工藝流程優化,又能節約成本,提升效率的最新技術。

  為解決這一難題,中科院過程所經過長期探索,逐步認識到多尺度結構和離散化是許多工程問題的共同特徵,由此建立了相應的通用演算法框架和專門的硬體體系結構,通過模擬物件、軟體和硬體的結構一致性實現高效能、低成本的超級計算。而2007年英偉達™(NVIDIA®) CUDA™和Tesla™ GPU的釋出為由商用部件搭建此類系統提供了可能。過程所敏銳地抓住了這個機遇,於2009年成功搭建了主要基於英偉達™(NVIDIA®) Tesla™GPU的多尺度離散模擬平行計算系統,單精度峰值超過每秒1000萬億次浮點運算。為過程模擬提供了強大而實用的工具從而服務於節能減耗和工藝流程優化。目前過程所正與聯想和曙光合作將為國內近十家使用者分別建立百萬億次級GPU+CPU異構並行系統,實現其在過程工程、資訊科技和基礎科學研究等多個領域的應用。

  與以前單純的CPU平臺相比,應用英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)的新平臺不僅成本大幅降低,還能極大提高計算機效率,如某大企業冶金過程的離散粒子模擬的速度提升了50倍。

  中國科學院過程工程研究所研究員、超級計算系統專案負責人葛蔚說:“通過GPU對相關軟體和硬體能力的提升,不僅能耗大幅降低,還可以使某種化工反應器模擬時間從一天縮短到2分鐘。這是一個革命性的進展。”

  利用GPU超級計算系統,過程所已成功開展了多相流動直接數值模擬、材料和納微系統微觀模擬和生物大分子動態行為模擬等應用,證明了多尺度離散化平行計算模式的優勢和前景。例如,對過程工業中常用的流態化反應器,通過模擬方法上的改進,該系統已能按接近實時的速度從毫米級的顆粒尺度模擬米級的巨集觀行為。這種能力在某清潔汽油生產工藝的開發和優化中已經並將進一步發揮重要作用。該系統也正應用於縫洞型油藏的驅採過程模擬。採用該系統的96個GPU,對含有100微米左右縫隙的0.16平方米的岩石樣本,直接數值模擬的速度達到了4秒鐘計算物理上的1小時,從而能有效替代能費時費力的物理實驗。而對於冶金過程,該系統甚至能對數千立方米的高爐中釐米級的礦石物料進行全系統的三維動態模擬。如採用120個GPU,5個小時就能復現一個完整的布料過程。目前該系統已在寶鋼新型鋼渣處理工藝的開發中得到實際應用。在上述過程中,英偉達™(NVIDIA®) GT200 GPU的實際單精度速度普遍達到了CPU核的三十倍以上,甚至超過百倍,應用效果非常顯著。

  英偉達™(NVIDIA®) Tesla™ GPU(圖形處理器)在計算流體動力學上的應用

  分子動力學(molecular dynamics,MD)模擬是隨著計算機技術的發展而興起的一種科學計算方法,現已應用到廣泛的領域中,如醫藥、材料、能源、機電等。隨著奈米、微機電和微化工等技術的興起,納微流動的MD模擬近年來也成為熱點。傳統連續流體力學難以處理和解釋這些尺度上的獨特性質與現象,而流動歸根結底是流體分子的集體行為,MD模擬能詳細跟蹤每個分子的運動,並通過分析速度、溫度等統計性質闡釋理論中的難點、發現新的機理,故日益受到重視。但計算能力一直是制約此研究發展的瓶頸。現在這方面很多成熟演算法都基於傳統體系結構的中央處理器(CPU),但其發展已顯頹勢。圖形處理器(GPU)的計算能力現已遠高於CPU一到兩個量級。如何在MD流動模擬中利用GPU的強大能力已成為一個重要的現實課題。

  中國科學院過程工程研究所多相複雜系統國家重點實驗室進行了圖形處理器(GPU)上的分子動力學(MD)模擬。即利用配備了一片英偉達™(NVIDIA®) Tesla™ C870的服務系統來執行英偉達™(NVIDIA®) CUDA™架構, 通過方腔流及顆粒-氣泡接觸等例項初步展示了此方式從微觀上模擬介觀行為的能力。經證實,在英偉達™(NVIDIA®)公司技術助力下,該計算過程速度是以往運用單核CPU計算的20到60倍,最高可達150 Gflops。

  傳統GPU對非圖形應用支援有限,只能通過圖形API程式設計,記憶體頻寬較低且訪問限制多,從而制約了其效能發揮。英偉達™(NVIDIA®) CUDA™的釋出打破了傳統GPU的效能瓶頸,提供了新的軟硬體架構。本次模擬的多相體系中,CUDA™把GPU直接視作資料平行計算裝置而不再將計算對映到圖形操作上,以擴充套件性較好的區域分解和常用的訊息傳遞介面(Message Passing Interface, MPI)協議實現各節點間GPU的平行計算,以類C語言的方式給開發者更大自由來實現GPU演算法。CUDA™還能結合OpenMP,MPI和PVM等其他並行方式在節點內和節點間繼續擴充套件計算能力,更好的發揮了GPU的強大效能,並將計算中的資料訪問效率提高了一個量級以上。Tesla C870的有效計算效能(指計算分子對相互作用時的浮點運算元)是以往所採用的單核CPU的20~30倍。若考察極端情況,即只測試耗時最長的分子間作用力計算,GPU更佔優勢, 約能發揮150 Gflops,佔其可利用計算峰值(346 Gflops)的40%多,而CPU能發揮2.4 Gflops,GPU的計算能力達到CPU的60倍之多!說明GPU很適合像多體問題。

  方腔流是流體動力學的一個經典問題,本次模擬將GPU應用於方腔流的MD模擬,使得模擬體系的規模有較大提高,在一定程度上達到了(亞)微米尺度,溝通了連續的流體力學和離散的分子動力學。而多相納微流動研究對奈米、材料、生物、微機電與微化工系統等技術領域更有實用性,但也更有挑戰性,目前還沒有成熟的理論方法,其MD模擬需要更多的計算資源且實現更加複雜,因此GPU的應用顯得更有價值。另一方面, 利用CUDA™技術和MPI協議,MD模擬可以實現某些物理實驗難以進行的極端情況,這是MD模擬非常值得關注的新方式。總體來說,GPU在MD模擬上的應用還有巨大的潛力。如需進一步瞭解,請參閱科學出版社於2009年出版的《基於GPU的多尺度離散模擬平行計算》一書。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22785983/viewspace-682491/,如需轉載,請註明出處,否則將追究法律責任。

相關文章