Ubuntu k80深度學習環境搭建

多特多完發表於2020-06-24

英偉達驅動安裝

  1. 英偉達驅動下載:https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/
  2. 由於是驅動的衝突,那麼自然是要殺掉和顯示卡結合不是那麼緊密的草根板驅動nouveau了,加入黑名單是我們要做的第一件事,這樣啟動以後就不會預設使用草根驅動;
cd /etc/modprobe.d/
# 資料夾下建立
touch blacklist-nouveau.conf
vim blacklist-nouveau.conf
blacklist-nouveau.conf 中加入黑名單
blacklist nouveau
options nouveau modeset=0
# 更新的blacklist
update initramfs -u命令得到
# 重啟系統,強力保證blacklist生效
reboot
# 檢視是否vouveau真的被禁止掉了,如果沒有任何內容出現,那麼草根驅動被禁止掉了
lsmod | grep nouveau

下載NVIDIA官方的K80顯示卡驅動,一般驅動都是通過deb包進行安裝,但是安裝後會加入OpenGL的驅動,所以必須得使用.run的檔案,.run檔案下載地址:https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/

如果不用.run方式的話,那麼就會進入Linux的無限迴圈介面。

./XXX-NVIDIA.run --no-opengl-files

(重要的事情說三遍,這裡面的-和字母之間沒有空格、這裡面的-和字母之間沒有空格、這裡面的‘-’和字母之間沒有空格)

出現藍色的背景介面,如果出現了(X server is running的現象,要注意使用者態輸入sudo service lightdm stop關閉桌面管理器 ),然後accept協議,接著出現the distribution provided pre-install scripts failed的提示,忽視它,然後繼續安裝下去,一路OK然後reboot系統,最終得到完整的gnome桌面系統。

sudo service lightdm stop

檢驗是否安裝成功,在命令列介面下輸入 nvidia-smi檢驗是否安裝成功

nvidia-smi

安裝源管理軟體包Anaconda:

下載地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.sh/

Cuda安裝:

  1. 下載CUDA
    https://developer.nvidia.com/cuda-downloads/
  2. 安裝cuda
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt update
sudo apt -y install cuda
  1. 將CUDA路徑新增至環境變數在終端輸入
sudo gedit /etc/profile

在profile檔案中新增:

export CUDA_HOME=/usr/local/cuda-8.0
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

source /etc/profile即可

source /etc/profile
  1. 驗證安裝成功:
nvcc -V

會得到相應的nvcc編譯器相應的資訊,那麼CUDA配置成功了。(記得重啟系統)
5. 如果要進行cuda效能測試,可以進行:

cd /usr/local/cuda/samples
sudo make -j8

編譯完成後,可以進samples/bin/.../.../...的底層目錄,執行各類例項。

安裝tensorflow

  1. 官方連線:https://www.tensorflow.org/install/install_linux/
  2. 參考官方文件的pip源部分:
    官方文件的pip源部分]
  3. pip安裝的時候千萬注意:
    sudo pip3 install –upgrade 後面的接的gpu版本的連線,在官網文件最後面,python務必與對應的tensorflow版本對應。
    官方文件的pip源部分

安裝完後也要注意依賴庫版本的修復,因為開原始碼,版本庫版本特別多,所以如果有版本不相容,那麼一定要進行修復,如何修復自行百度。
4. tensorflow驗證:

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))

安裝keras:

  1. 安裝keras:
sudo pip install -U --pre keras
  1. 安裝完畢後,輸入python,然後輸入:
 import tensorflow
 
 import keras
  1. Keras中mnist資料集測試
git clone https://github.com/fchollet/keras.git
cd keras/examples/ 
python mnist_mlp.py

程式無錯進行,至此,keras安裝完成。

相關文章