超順 | Ubuntu16 安裝配置aws gpu

weixin_34249678發表於2018-03-13
3775508-3a747ea2406d694e.jpg
亂花漸欲迷人眼,淺草才能沒馬蹄

購買了AWS GPU來跑深度學習程式碼,簡單配置了伺服器環境,筆者本地環境為win7 x64,所購買伺服器環境為ubuntu6、python3,下面記錄安裝步驟CUDA8、cuDNN、tensroflow-gpu1.3
如有問題,歡迎拍磚

操作開始前,讀者可以從這裡下載我們所需要的安裝包,請戳我 密碼為:j8um

賬號

有了aws 伺服器賬號密碼後,對應也有收到祕鑰檔案,ssh登陸使用,我們下載安裝PuTTY,使用 PuTTYgen 轉換私有金鑰,可以[參考這裡],將生成PuTTY 可以使用的格式儲存的金鑰--.ppk結尾(https://docs.amazonaws.cn/AWSEC2/latest/UserGuide/putty.html)

3775508-76ec4c0ca15b5bc3.png
PuTTYgen操作.png

然後啟動PuTTY,紅色箭頭地方寫入對應域名
3775508-e74859a51b6fb987.png
host.png

下圖紅色部分匯入上一步生成的.ppk檔案
3775508-29c2424d4f8c6211.png
Auth.png

  • 以上操作完成,點選open 會開啟伺服器端,輸入賬號密碼登陸即可
  • 可使用WinSCP 進行windows與伺服器檔案的傳輸,速度還是很給力的,也可以在本連結參考詳細步驟

登陸後下面開始安裝環境

1. 更新apt-get源列列表
sudo apt-get update
sudo apt-get upgrade

2. 新增驅動源
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

3. 安裝Nvidia驅動
sudo apt-get install nvidia-367
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev

第四步使用紅色標註的方式安裝CUDA8.0,根據自己環境修改對應檔案路徑


3775508-7388f264b5320a40.png
step4.png
5. 更改配置檔案
vim ~/.bashrc
新增
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
儲存

安裝完成後我們使用如下方式驗證下:

// samples備份,以防破壞
cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery
3775508-d8a1147aa1691e2e.png
CUDA8驗證.png
6. 下載安裝CUDNN
如果要使用gpu來對tensorflow進行加速,除了安裝CUDA以外,cuDNN也是必須要安裝的
這個安裝包,文初雲盤連結裡面已包含
wget http://developer.download.nvidia.com/compute/redist/cudnn/v6.0/cudnn-8.0-
linux-x64-v6.0-rc.tgz

mkdir cuda
mv cudnn-8.0-linux-x64-v6.0-rc.tgz cuda/
cd cuda/
gunzip cudnn-8.0-linux-x64-v6.0-rc.tgz
tar xvf cudnn-8.0-linux-x64-v6.0-rc.tar
cd cuda/
cd ..

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

7.配置python3環境變數,可參考這裡,筆者使用如下方式進行配置

echo alias python=python3 >> ~/.bashrc
source ~/.bashrc

8.安裝tensorflow-gpu 1.3,讀者可以從這裡下載已上傳至雲盤

pip3 install tensorflow_gpu-1.3.0rc0-cp35-cp35m-manylinux1_x86_64
安裝完成後,命令列輸入:python ,執行下面操作,檢視tf版本號
import tensroflow as tf
tf.__version__ 

至此,伺服器上深度學習環境配置完畢。

可參考文章

相關文章