Win10 x64 + CUDA 10.0 + cuDNN v7.5 + TensorFlow GPU 1.13 安裝指南

☆磊☆發表於2017-09-30

Win10 x64 + CUDA 10.0 + cuDNN v7.5 + TensorFlow GPU 1.13 安裝指南

Update : 2019.03.08

0. 環境說明

硬體:Ryzen R7 1700x + GTX 1080Ti

系統:Windows 10 Enterprise Version 1809 Update March 2019

1. 前期工作

NVIDIA 419.35 驅動

Visual Studio 2017 (需要C++部分)

Python 3.6.x x64

2. 安裝CUDA和cuDNN

2.1. CUDA 10.0

下載地址:https://developer.nvidia.com/cuda-10.0-download-archive

2.2. cuDNN v7.5 for CUDA 10.0

下載地址:https://developer.nvidia.com/rdp/cudnn-download

解壓後覆蓋到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0目錄即可。

2.3. CUDA Profiler Tools Interface (CUPTI)[可選]

下載地址:https://developer.nvidia.com/CUPTI

CUDA 工具包附帶

2.4. NCLL 2.4[可選]

下載地址:https://developer.nvidia.com/nccl/nccl-download

可實現多 GPU 支援。僅支援Linux。

2.5. TensorRT 5.0[可選]

下載地址:https://developer.nvidia.com/nvidia-tensorrt-download

可縮短在某些模型上進行推斷的延遲並提高吞吐量。僅支援Linux。

3. 安裝DXSDK_Jun10【不確定是否必須】

DXSDK_Jun10.exe下載地址:https://www.microsoft.com/en-us/download/details.aspx?id=6812

Win10安裝時會提示S1023的錯誤,不用管。C:\Program Files (x86)\Microsoft DirectX SDK (June 2010)\Include\d3dx9.hd3dx10.hd3dx11.h 檔案存在就可以。

這些都裝完了就可以到C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0中開啟專案。

一共155個,都編譯成功即可。然後到C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\bin\win64\下的DebugRelease內找到deviceQuery.exe,用命令列執行,不報錯說明CUDA安裝成功。

4. 安裝Tensorflow GPU 1.13.1

pip install --upgrade tensorflow-gpu

使用下列程式碼測試安裝正確性

>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))

5. 常用庫

pip install --upgrade numpy
pip install --upgrade scipy
pip install --upgrade pandas
pip install --upgrade keras
pip install --upgrade matplotlib

6. 其他

Ryzen R7 1700x支援:SSE、SSE2、SSE4.1、SSE4.2、AVX、AVX2、FMA。

Win10下的nvidia-smiC:\Program Files\NVIDIA Corporation\NVSMI 目錄內。

相關文章