純新手入門安裝TensorFlow並寫Hello(mac版)

weixin_34007291發表於2017-11-27

在深度學習大熱的情況下很自然地考慮要用一些類似的工具來做一些有意思的事情,一個常用的工具就是TensorFlow,TensorFlow是一個採用資料流圖(data flow graphs),用於數值計算的開源軟體庫,也就是說它是一個庫,提供API供你使用,來用特殊的資料流圖的方式轉換你的演算法計算,從而得出結果的工具。

要使用第一步就是安裝環境了,查資料配置了一番,執行hello world程式成功了,這裡記錄一下過程。

環境說明

題目說明了,我是在mac環境下配置的,系統版本為:macOS 10.12.5。

TensorFlow支援多種語言,我用的是python。

安裝的TensorFlow版本為macOS的1.3.0 純CPU無GPU版,另有含GPU版,可以利用GPU提升計算速度。關於TensorFlow的版本資訊可以看它的github

安裝指南

TensorFlow的官網是英文的,英文好的可以直接看官網,資訊比較新也比較全。英文吃力的可以先看中文社群,也還行,其中也有安裝的說明,不過也會遇到一些坑,因此才有了我這篇。

其實安裝有多種方式,光是在mac上就可以通過homebrew、Docker、映象、VirtualEnv等,我選擇的是基於VirtualEnv安裝,因為這樣可以建立一個隔離的容器, 來安裝 TensorFlow。這是可選的, 但是這樣做能使排查安裝問題變得更容易。也就是說我們建立了一個單獨的環境來安裝和執行TensorFlow,甚至mac本身就有的python環境好像也另外安裝了一份。

基於VirtualEnv安裝的步驟如下:

如果沒有安裝 pip的話,先安裝pip:

$ sudo easy_install pip  # 如果還沒有安裝 pip
$ sudo pip install --upgrade virtualenv

接下來, 我們建立一個全新的 virtualenv 環境。為了將環境建在 ~/tensorflow 目錄下, 執行:

$ virtualenv --system-site-packages ~/tensorflow
$ cd ~/tensorflow #進入該目錄

然後, 啟用 virtualenv(不用了就要手動停用):

$ source bin/activate  # 如果使用 bash
$ source bin/activate.csh  # 如果使用 csh
(tensorflow)$  # 終端提示符應該發生變化

上面兩個source命令只需要根據情況執行一種,我使用的是第一種,執行命令後,命令前會多一個(tensorflow)提示符,這表示啟用成功了,之後的操作都會在此環境下執行。

接著就在 virtualenv 內, 安裝 TensorFlow:

(tensorflow)$ pip install --upgrade <$url_to_binary.whl>

注意,上面的 <$url_to_binary.whl> 並不是要原封不動地輸入,而是根據你要安裝的TensorFlow版本替換成不同的內容,比如我安裝1.3.0無GPU版的,就改成如下:

(tensorflow)$ pip install --upgrade https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-1.3.0-py2-none-any.whl

其他版本大同小異,比如該系統名,改版本號數字,改python版本數字,有無GPU等,版本資訊可以在github看到最新的。

到此,TensorFlow就安裝完成了!

其實,如果不想在一個虛擬環境中安裝,而是直接在整個系統中安裝,也不挑版本,則可以直接用:

pip install tensorflow

來安裝,pip會自動選擇合適你python版本的、符合你gpu的、最新的TensorFlow來安裝,如果是python3就用pip3安裝。

寫個Hellow World

常見的,安裝完後我們寫個小程式來試一試,我用的是python語言:

import tensorflow as tf

# 輸出Hello, TensorFlow!
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print sess.run(hello)

# 計算 10 + 32 並輸出
a = tf.constant(10)
b = tf.constant(32)
print sess.run(a+b)

# 把一個1*2的矩陣和一個2*1的矩陣相乘並輸出
matrix1 = tf.constant([[3., 3.]])
matrix2 = tf.constant([[2.],[2.]])
product = tf.matmul(matrix1, matrix2)
result = sess.run(product)
print result

sess.close()

關於這段程式碼做什麼,註釋裡已經說了,其實大概也能看懂,具體的語法可以到官網或者中文社群去學習,瞭解基本用法就能看懂了。

要執行,只需要把這段程式碼放到一個命名為 hello.py 的python檔案,將檔案放到我們建立的~/tensorflow目錄(如果找不到這個目錄,可以在終端輸入 open ~/tensorflow 來在Finder中顯示目錄)下,或者其他目錄下也可以,只是要在終端命令中進入該目錄,然後執行該python檔案即可:

(tensorflow)$ python hello.py

輸出結果應該為:

Hello, TensorFlow!
42
[[ 12.]]

除了結果之外,因為我安裝的是無GPU版本的,它可能還會提示你可以利用GPU來急速計算。

不再使用之後,最好停用 virtualenv:

# 當使用完 TensorFlow
(tensorflow)$ deactivate  # 停用 virtualenv

$  # 你的命令提示符會恢復原樣

到此為止,就已經安裝好環境並且執行Hello程式了,不算太難,只是對於新手來說容易有點摸不著頭腦不知道在幹什麼。此外,光看Hello程式會覺得TensorFlow做得事情很簡單,但這只是因為我們的例子簡單,TensorFlow主要方便用來做複雜計算的,它是一個數值節點、操作節點以及之間連線表示流程圖的結構,想象一下神經網路,還是很相似的。我還只是一個新手,對其的理解也很淺薄,希望以後可以繼續學習來做出一些真正有意思的事情。


檢視作者首頁

相關文章