計算新趨勢 瞭解GPU計算和Tesla工作站

洛欣發表於2011-02-10
如今在高效能運算領域混合計算成為新的關鍵詞,位於世界先列的超級計算機有很多都採用了CPU+GPU的混合計算模式,如我國的“天河一號”,GPU計算在其中起到了重要的作用。那麼,什麼是GPU計算?GPU計算為何能夠獲得業內的青睞?


  什麼是GPU?


  GPU這個詞從1990年便開始使用,對應人們熟知的CPU(中央處理器),GPU指的是顯示卡上所使用的針對影像處理的處理晶片。GPU雖然發展的日期尚短,但是它一早就具備了多核心運算的優越功能。今天,人們使用的遊戲顯示卡中,以非常廉價的9600gt顯示卡為例,它具有64個流處理器,我們稱它們為cuda處理器,也就是說一個9600gt的GPU它具備著64個運算核心,跟當前最多的8核的CPU對比,足足8倍。如果是像gtx295或者最新的gtx480等,更高達480個運算核心。即便每個核心的工作效率比CPU的低一半,但是這個龐大的數量就足以彌補這些缺陷。


  GPU計算和Tesla


  隨著GPU的日益發展,人們慢慢意識到GPU的真正潛力。2009年,NVIDIA公司正式把cuda的編譯模式公開化,讓眾多程式設計人員一窺cuda的祕密。NVIDIA也把手上的拳頭產品重新包裝完善後,推出讓業界震驚的tesla工作站。


  這個命名為tesla的工作站就是通過高密度整合cuda運算叢集,已達到幫助程式開發人員實現利用cuda強大的叢集運算模式,解決更高強度的運算工作。例如,空間資料運算,三維空間的高強度物理運算,系統分析和時下流行的動畫渲染工作。在這樣的新機器推出後,過去很多不可能完成的任務,如今都變得非常輕鬆。


  Nvidia舉辦的專家聚會當中,就有專家提出了很多著名的例子,如加勒比海盜2中兩艘海盜船在巨型漩渦中對戰的畫面。製作專家指出,當時他們使用的是當時市面最先進的一套渲染農場,估計有20到40個節點左右。他們渲染那段畫面中的一幀就耗費了20個小時,一個單幀畫面就耗費了一個渲染農場20個小時的時間。然後他又指出,當他使用到GPU運算後,他發現時間至少會有10至15倍的縮減。


  另外一個例子,另一個專家在闡述他們製作變形金剛2的製作過程中,裡面的一段挖掘金字塔頂部的動畫中使用到大量的粒子。而這樣的運算量,在過去的CPU運算時代是不可能實現的。最終他們利用GPU運算這一先進技術解決了這個難題。更有專家指出在2012電影中所看見的大量破壞畫面,都是依賴GPU雲運算得以解決,而使到畫面更逼真更巨集大。


  Tesla工作站是專門針對未來的GPU雲運算市場所開發的利器。到底Tesla有什麼出眾的特點呢?


  Tesla工作站基於NVIDIA公司開發的Tesla顯示卡為中心的超級工作站,真正的主角就是這塊tesla顯示卡。它具有448個cuda運算核心,3G/6G視訊記憶體,1T的單精度運算速度和0.5T的雙精度計算速度。其他的引數大可不必多說,來打個比方,這意味著這塊tesla顯示卡中,具有448個1t運算速度的運算核心一同運算,並且具備3G/6G的顯示記憶體可以供給呼叫,足夠應付各種龐大的運算,如果對應當前的8核CPU的話,那就相當於60個CPU一同工作,相當於30臺雙CPU的工作站的運算量,根本不用提及現在市面還沒有1t的運算速度的CPU銷售。


下面是筆者用自己的電腦和單片tesla工作站之間做了一個對比,筆者電腦使用的顯示卡為一quadro fx1800,電腦的渲染時間為7小時,運算取樣值為4096個運算取樣。應用Tesla工作站渲染時間為20分鐘,運算取樣值為8192個取樣。對比非常強烈。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22785983/viewspace-686942/,如需轉載,請註明出處,否則將追究法律責任。

相關文章