深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

李泽南發表於2017-06-26

原文網址 : https://www.jiqizhixin.com/articles/2017-06-26-9

本週一（6 月 19 日）機器之心發表文章《我的深度學習開發環境詳解：TensorFlow + Docker + PyCharm 等，你的呢（附問卷）》介紹了研究員 Killian 的深度學習開發環境：TensorFlow + Docker + PyCharm + OSX Fuse + Tensorboard，並附了一份調查問卷想要了解機器之心讀者配置的開發環境、對程式語言、框架的使用情況。雖然獲得的反饋量比較有限，但我們也觀察到了一些比較有趣的現象。在這篇文章中，我們將對此問卷的結果進行介紹，希望對需要配置開發環境的讀者有所幫助。最後，我們介紹了一種新的開發環境配置：Jupyter + Tensorflow + Nvidia GPU + Docker + Google Compute Engine。

問卷結果

該調查問卷文章釋出之後共有超過 10800 名讀者閱讀，收到大量有效答卷，另有 16 名讀者是以留言的方式在文章下介紹了自己的開發系統。大部分被調查者來自中國大陸，此外還有多名來自北美大學和研究機構的調查者參與其中。以下的資料統計圖表中，並不包含微信文章留言的資料。

根據表單後臺的資料統計，參與調查的讀者中大部分為學生，然後是開發工程師、研究員、產品經理等。

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

而在被調查者的研究方向上，計算機視覺領域佔比接近一半（48.2%），自然語言處理次之（26.8%），這部分反映了目前深度學習的主要研究方向。此外還包括金融風控、資料分析、現場安全識別、通訊、時空大資料、醫學影象、催化以及材料模擬等領域。

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

下面就開始詳細為大家介紹調查者們最常用的程式語言、深度學習框架，以及在開發過程中面臨的難題。

一、Python 成為深度學習主流語言

機器之心一直關注機器學習研究員、工程師在開發過程中所注重實用的工具、語言。在不久之前釋出的文章《業界 | 超越 R，Python 成為最受歡迎的機器學習語言》中，KDnuggets 與 O'Reilly 的調查結果都表明，越來越多的人開始使用 Python 進行機器學習。

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

2016 年 KDNuggets 調查結果

在機器之心問卷中，對於問題「您認為哪種語言會成為深度學習的主流語言？」，所有被調查者的態度完全一致：Python！看來，Python 已是絕大多數從業人員必須學習的語言，同時也是眾望所歸的未來主流深度學習語言。

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

O'Reilly 2016 年度資料科學薪資調查曾顯示：Python 和 Spark 是最對薪資有貢獻的工具。Python 具有開發速度快的特點，Caffe、TensorFlow 等主流深度學習框架都對其支援。騰訊最近推出的機器學習高效能運算平臺 Angel 在支援 Java、Scala 之外，也將在未來對 Python 提供支援。

在機器之心的問卷中，調查者反饋，雖然他們會使用其他程式語言，比如 R、C++，但實際執行程式的編寫還是主要使用 Python，簡單、開發速度快是很大的優勢。

其他語言的使用情況簡介如下：Matlab 用於快速完整、視覺化研究；R 方便框架模型的驗證分析，也便於處理資料和畫圖。因此，多數人在不同的開發流程中使用不同的語言。

二、TensorFlow 佔據半壁江山

而在框架方面，谷歌支援的 TensorFlow 就沒有這樣的壟斷地位了，不過它也已佔據了接近一半（48%）的水平。完善的功能和大量的支援文件（眾多 TensorFlow 支持者提到的）是目前 TensorFlow 的強項，存在於 GitHub 中的大量實現更是不容忽視，視覺化工具 TensorBoard 則為開發者提供了直觀的引導。但由於網路問題，TensorFlow 系統在大陸的搭建是個難題。部分被調查者也指出，TensorFlow 的 Windows 支援也為他們帶來了便利。

Facebook 新近推出的框架 PyTorch 人氣急劇攀升，在僅僅推出 5 個月的情況下達到了第二的位置（16%），因支援動態計算圖，易用性和強大的效能而出名。在業界還需要產品遷移的情況下，學界已經出現擁抱 PyTorch 的趨勢了。

同屬於 Facebook 的 Caffe/Caffe2 則佔據第三（14.7%），大部分被調查者在對於 Caffe 系列的評價中都提到了快速的特點。

此外，亞馬遜支援的 MXNet 佔據了 10.7% 的使用者數量，排名第四。被調查者認為，MXNet 擁有很好的社群支援，因而易於使用。

三、硬體

硬體方面，超過一半的被調查者明確表示自己的深度學習硬體是英特爾 Core i7 + 英偉達 Geforce GTX 1080（Ti）的組合。與 TitanX 相比，英偉達 Tesla 系列的應用顯得更少，看來英偉達推動的商用機器學習計算卡仍然需要進一步的推廣。由於資源限制，GPU 陣列的使用並不流行，而云服務也沒有被大部分開發者採用（也是經費原因）。

目前，雖然人們對於多 GPU/分散式機器學習訓練/處理的呼聲很高，但相關的教程和可以借鑑的方法仍顯欠缺，這或許是經費之外人們面臨的最大難題。

四、系統

Linux 顯然是深度學習的必備系統，雖然 TensorFlow 已有 Windows 支援，但大多數受訪者表示自己的深度學習機器使用基於 Linux 的 Ubuntu 系統。

五、面臨的難題

在搭建深度學習環境的過程中，各元件的相容性問題一直是困擾開發者們的難題，部分開發者表示依賴關係處理比較頭疼，而使用 Docker 可以部分解決這些問題。英偉達的 cuda/GPU 驅動程式安裝困難也是很多調查者提到的問題。

需要配置安裝很多不同的開發框架……還有擴充套件計算叢集……

本次深度學習開發環境調查已經結束，由於樣本數量限制，這次我們得出的結論可能不甚準確。深度學習的開發環境會隨著技術的發展不斷進化，未來究竟是百家爭鳴，還是一家獨大？歡迎大家前來討論。感謝大家對機器之心此次調查問卷的支援，獲得獎品同學的禮物已經寄出。

Jupyter + Tensorflow + Nvidia GPU + Docker + Google Compute Engine

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

這一部分，我們編譯了一篇新的深度學習開發環境配置：Jupyter + Tensorflow + Nvidia GPU + Docker + Google Compute Engine。

動機：商業上喜歡快捷、且由資料驅動的洞見，因此他們聘請了資料科學家來處理這些任務。實踐性的資料科學是探索性、迭代性的過程，這個過程要求大量的計算資源和時間。資料科學家經常使用 Jupyter notebook 以更好地支援這種探索性的迭代，同時更傾向於使用 GPU 以加速 Tensorflow 專案的計算。然而，GPU 成本比較高，而計算資源也需要小心地管理以滿足商業上對高效運算的需求。

近來雲端計算傾向於使用 Kubernetes 和 Docker 提高資源利用率。那資料科學的工具（如 Jupyter 和 GPU 等）嵌入 Docker 和 Kubernets 會更有效嗎？也許這樣更節約時間和記憶體，我前面已經用過了其他版本，但現在的環境配置是比較優秀的。

建立一個 GCE 例項

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

首先，建立防火牆規則，將 Jupyter（8888）和 Tensorboard（6006）新增到白名單中。

然後建立一個 GCE 例項，對於該案例：

使用的系統為 Ubuntu 16.04 LTS
分配 50GB 的啟動盤
至少需要一個 K80 GPU
將 jupyter 和 tensorboard新增到你建立的防火牆規則中。

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

安裝和確認 CUDA 能訪問 GPU

使用英偉達的 CUDA 庫取得訪問 GPU 的許可權。

下一步需要將 SSH 新增到你建立的計算節點中，然後使用指令碼安裝 CUDA（https://cloud.google.com/compute/docs/gpus/add-gpus）：

#!/bin/bashecho "Checking for CUDA and installing."# Check for CUDA and try to install.if ! dpkg-query -W cuda; then # The 16.04 installer works with 16.10. curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.61-1_amd64.deb dpkg -i ./cuda-repo-ubuntu1604_8.0.61-1_amd64.deb apt-get update apt-get install cuda -yfi

然後你能使用 wget 命令 pull 來源 gist 並輸入到 bash 中：

wget -O - -q 'https://gist.githubusercontent.com/allenday/f426e0f146d86bfc3dada06eda55e123/raw/41b6d3bc8ab2dfe1e1d09135851c8f11b8dc8db3/install-cuda.sh' | sudo bash

如果 CUDA 安裝成功了，執行 nvidia-smi 命令將返回表格顯示可用的 Tesla K80 GPU：

nvidia-smi

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

安裝 Docker(-Engine) 和 Nvidia-Docker

對於 docker，我們需要從 Docker 獲取 docker-ce 版本，而不是 Ubuntu 自帶的 docker.io 包。可以使用以下指令碼完成（https://docs.docker.com/engine/installation/linux/ubuntu/）(https://docs.docker.com/engine/installation/linux/ubuntu/%EF%BC%89)：

#/bin/bash# install packages to allow apt to use a repository over HTTPS:sudo apt-get -y install \apt-transport-https ca-certificates curl software-properties-common# add Docker』s official GPG key:curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - # set up the Docker stable repository.sudo add-apt-repository \ "deb [arch=amd64] https://download.docker.com/linux/ubuntu \ $(lsb_release -cs) \ stable"# update the apt package index:sudo apt-get -y update# finally, install dockersudo apt-get -y install docker-ce

或使用我的：

wget -O - -q 'https://gist.githubusercontent.com/allenday/c875eaf21a2b416f6478c0a48e428f6a/raw/f7feca1acc1a992afa84f347394fd7e4bfac2599/install-docker-ce.sh' | sudo bash

從 deb 檔案安裝 nvidia-docker（https://github.com/NVIDIA/nvidia-docker/releases/）：

wget https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb

從 Docker 容器確認 GPU 是可用的

起始化 nvidia-docker-plugin 需要在跟許可權下執行：

sudo nvidia-docker-plugin &

nvidia-docker-plugin | 2017/06/07 01:05:05 Loading NVIDIA unified memorynvidia-docker-plugin | 2017/06/07 01:05:05 Loading NVIDIA management librarynvidia-docker-plugin | 2017/06/07 01:05:08 Discovering GPU devicesnvidia-docker-plugin | 2017/06/07 01:05:08 Provisioning volumes at /var/lib/nvidia-docker/volumesnvidia-docker-plugin | 2017/06/07 01:05:08 Serving plugin API at /run/docker/pluginsnvidia-docker-plugin | 2017/06/07 01:05:08 Serving remote API at localhost:3476

現在確保 docker 容器可以看到 GPU：

sudo nvidia-docker run --rm nvidia/cuda nvidia-smi

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

如上圖所示，現在得到的表格和前面使用 nvidia-smi 命令，且沒有在 Docker 容器裡執行得到的表格是一樣的。

建立一個 Snapshot 卷

如果你跟著上面執行下來了，你可能注意到它需要花費一點時間。而當我們執行 GPU 例項時，那成本就比較大了。所以我們需要避免重複以上過程浪費時間和記憶體，我們可以將以上過程做一個整合，當我們需要啟動 GPU 時就可以直接使用。

登陸 Jupyter 和 TensorBoard

sudo nvidia-docker run --rm --name tf1 -p 8888:8888 -p 6006:6006 gcr.io/tensorflow/tensorflow:latest-gpu jupyter notebook --allow-root

上面命令可以展示為一個連結：

http://localhost:8888/?token=c8caba947dfd4c97414447c074325faf399cf8a157d0ce2f

最後尋找一個 GCE 例項的外部 IP 地址，並將它連線到埠 8888，即 http://EXTERNAL_IP:8888/，從你的控制檯鍵入類似的符號，現在你就擁有了一個可以在 GPU 上執行 TensorFlow 的 Jupyter notebook。

深度學習環境配置
2024-10-08
深度學習
深度學習環境配置（windows 11）
2024-09-05
深度學習Windows
JAVA學習——JDK開發環境配置
2024-07-08
JavaJDK開發環境
Ubuntu18.04深度學習環境配置
2020-10-13
Ubuntu深度學習
配置開發環境、生成環境、測試環境
2024-06-01
開發環境
你生產環境的 Composer 是這樣嗎？
2019-03-30
開發環境配置
2019-12-02
開發環境
emacs開發環境配置(4)——rust開發環境
2021-11-10
Mac開發環境Rust
js開發環境配置
2019-01-13
JS開發環境
react 配置開發環境
2019-02-27
React開發環境
Ubuntu開發環境配置
2024-11-20
Ubuntu開發環境
weex開發環境配置
2018-04-25
開發環境
Arduino開發環境配置
2024-05-28
UI開發環境
Java開發環境配置
2023-02-26
Java開發環境
《學習 VUE - Windows 下配置 vue 的開發環境》
2020-04-03
VueWindows開發環境
【深度學習】PyTorch CUDA環境配置及安裝
2021-04-19
深度學習PyTorch
app自動化測試環境配置：adb環境配置、monkey環境配置、appium環境配置大全
2020-06-28
APP
Webpack4 學習筆記八開發環境和生產環境配置
2019-01-25
Web筆記開發環境
《學習 VUE-Windows 下配置 vue 的開發環境》
2020-04-03
VueWindows開發環境
tensorflow學習筆記1——mac開發環境配置
2019-02-16
筆記Mac開發環境
MacOS PHP 開發環境配置
2018-10-26
MacPHP開發環境
Docker配置PHP開發環境
2019-02-16
DockerPHP開發環境
VSCode Python開發環境配置
2019-01-07
VSCodePython開發環境
Mac 基本開發環境配置
2018-07-11
Mac開發環境
開發環境配置 - Linux（Ubuntu）
2018-06-04
開發環境LinuxUbuntu
(二) electron 開發環境配置
2018-07-27
開發環境
Android Studio配置開發環境
2020-11-02
Android開發環境
VSCode配置JAVA開發環境
2018-12-31
VSCodeJava開發環境
Vscode配置golang開發環境
2022-06-24
VSCodeGolang開發環境
MacOS 配置 Flutter 開發環境
2021-03-04
MacFlutter開發環境
新裝Ubuntu環境配置
2018-07-17
Ubuntu
環境配置
2024-07-12
谷歌JAX深度學習開發環境搭建
2022-10-17
谷歌深度學習開發環境
開發環境的 Ubuntu Desktop 18.04LTS 開發環境配置備忘
2019-02-28
開發環境Ubuntu
從零開始配置深度學習環境：CUDA+Anaconda+Pytorch+TensorFlow
2023-04-14
深度學習PyTorch
【機器學習】深度學習開發環境搭建
2018-11-26
機器學習深度學習開發環境
使用 NVIDIA Container Toolkit 和 Docker 配置 GPU 深度學習環境
2024-10-02
AIDockerGPU深度學習
Python開發環境的安裝配置
2018-12-16
Python開發環境
vs code配置Python開發環境
2019-04-10
Python開發環境

深度學習開發環境調查結果公佈，你的配置是這樣嗎？（附新環境配置）

相關文章