在 GTC 2017 大會上,NVIDIA 的 CEO 黃仁勳正式釋出了其新一代旗艦計算卡 Tesla V100,但是一項技術從釋出到真正使用到生產環境中,仍需要大量的時間。V100 何時才能夠被廣大消費者接觸到呢?阿里雲首先交出了自己的答卷。
近期,國內雲端計算一哥阿里雲開啟了新一代高效能 GPU 計算雲伺服器 GN6 系列的公測,也是國內運營商中首個提供最新 NVIDIA V100 GPU 的雲服務提供商。
據悉,新的計算例項搭載最新的 NVIDIA V100 計算核心,宣稱可帶來數倍的深度學習效能提升。究竟搭載英偉達V100的阿里雲GPU例項有幾把刷子,我們申請了一臺最新的GN6系列雲伺服器,進行了深度測試,一起來看下。
人工智慧市場爆發 GPU雲伺服器成香餑餑
隨著人工智慧的發展,基於 GPU 的異構計算開始不斷升溫。特別是傳統的 CPU 通用計算由於受到半導體工藝、儲存頻寬瓶頸等問題,開始在人工智慧的運算中顯露疲態。而 GPU 由於省去了 CPU 中複雜的控制流,可以將所有算力都投入到深度學習所需要的向量運算中去,大大提高了算力和算力利用率。
除了效能之外,帶來的更多的還是成本的降低。按照傳統方案,雲服務商可以採購4個機架、共160個CPU伺服器,在功耗65千瓦的情況下提供每秒45000張照片的處理能力。而如果換成GPU的產品,你可能只需要一個裝有8片GPU的伺服器,同樣的每秒45000張照片處理能力,但是你只需要7個伺服器插槽,總共的功耗也只有3千瓦。
在公測期間,使用者可以登陸阿里雲平臺提交測試申請,提交申請的使用者會拿到阿里雲異構計算平臺提供的 GN6 雲伺服器,進行業務和平臺驗證。如果你像我一樣,忍受不了長時間的計算,那麼GN6系列可能是在目前所有的選擇中最合適的那一款。
得益於搭載的 NVIDIA V100 GPU 擁有的新的 VOLTA 架構及新增的 Tensor 單元等因素,GN6 雲伺服器相比前代 GN5 雲伺服器擁有更加強勁的效能,能夠以更少的時間花費來完成計算。
從P100到V100 效能提升近300%
我們也透過申請拿到了一臺 GN6 雲伺服器( 例項 ID ecs.gn6p-c8g1.2xlarge,8 vCPU ,32GB 記憶體)來測試,同時我們還購買了幾個同配置的其他機型,來進行對比測試,具體的測試結果如下:
使用 MXNet 框架,測試 Inception-V3 網路在 ImageNet 資料集的影像分類訓練的 Benchmark 效能
使用 NVCaffe 框架,測試 GoogLeNet 網路在 ImagNet 資料集的影像分類訓練效能
目前來說,社群的框架還沒有更新到能夠完全利用 TensorCore 的水平,所以效能無法達到在釋出會上聲稱的十數倍的提升,不過即使是在這種情況下,我們測試到的結果依然表現不俗,效能相比於前代 GN5 雲伺服器提升了接近 3 倍。同樣工作量的訓練任務工作時間將壓縮過半。
隨著後續機器學習框架不斷升級最佳化,TensorCore 的效能將得到全面發揮,將會給機器學習帶來再一次大幅度提速。
姍姍來遲的基礎映象 雲伺服器開箱即用
一直以來,我們購買 GPU 雲伺服器後,都需要花費大量的時間來進行基礎環境的配置、安裝 NVIDIA 的驅動。在此處更新中,阿里雲還上線了新的基礎映象,新的基礎映象預裝了 NVIDIA GPU 驅動和深度學習框架的系統映象,我們在雲伺服器啟動隨即可以準備開始進行深度學習的計算,大大節省了環境配置的時間,減少重複工作,GPU 雲伺服器也終於做到了開箱即用。
建立雲伺服器時,開發者可以直接在選擇映象時在映象市場搜尋”深度學習”,就可以找到預裝深度學習框架的系統映象,點選使用就可以直接建立開箱即用的 GPU 雲伺服器。
我們在使用 GPU 雲伺服器進行深度學習所需要的準備時間從原來的數個小時縮短到了不到五分鐘,確確實實節省了大量的工作時間。
總結
就目前人工智慧而言,已然進入戰國時代,而且各家的產品都有可能在這個廣闊的市場中找到自己的定位和細分市場,從跑分來看,阿里雲的 GN6系列雲伺服器是市面上效能最強的GPU雲伺服器,,沒有之一。在易用性上,一鍵部署、映象市場等服務都有不俗的表現。
在價格方面,阿里雲GN6相比同類的V100伺服器要低上不少,讓我們看到了作為雲端計算領軍者的誠意。同時我們也相信未來會有更多的雲廠商推出類似的服務,讓整個人工智慧市場擁有強大的計算能力。