TensorFlow: 薛定諤的管道

深度學習大講堂發表於2018-06-13

原文網址 : http://www.jiqizhixin.com/articles/2018-06-20-15

要說史上最著名的貓，大概就是薛定諤的那隻了。它被關在裝有少量鐳和氰化物的密閉容器裡，當鐳發生衰變時，就會觸發機關打碎裝有氰化物的瓶子，貓就會死亡；如果鐳不發生衰變，貓就會存活下來。在量子力學理論中，由於放射性的鐳處於衰變和沒有衰變兩種狀態的疊加，這隻貓也處於生死疊加態，只有對其進行觀測，才能決定這隻貓的生死。

所以，哈姆雷特說：

生存還是死亡，這是一個問題！

今天我們從貓說起，來討論一個管道，一個蘊含著某些不確定性的管道：TensorFlow。我們從TensorFlow中的一個計算例項出發，在這個例子中的一個計算節點像薛定諤的貓一樣具備不確定性的輸出結果：如下圖所示的例子，同時計算節點assign和節點c時，c的計算結果out_c是不確定的,這是因為TensorFlow會盡可能的對計算過程並行化，所以out_c的結果依賴assign和c誰先執行。

TensorFlow: 薛定諤的管道

那麼面對這樣一個可能會產生“薛定諤現象”的框架，我們如何利用它來實現模型呢？

我們在使用TensorFlow這個軟體庫構建模型時，實際上是在TensorFlow提供的這套api系統裡編寫TF程式，這裡可以把TensorFlow看成是一門進行數值計算的“程式語言”。那麼為了更好的掌握TF這麼“語言”，我們可以從三個層次來學習：

理解TensorFlow的基本概念和基本元件
基於對基本概念的理解，利用基本元件來構建模型
除錯模型，優化模型速度，優化模型精度

這裡我們從理解基本概念以及一個除錯模型的例子出發，來介紹其實現模型計算的過程。

TensorFlow: 薛定諤的管道

TensorFlow的核心是通過資料流圖的方式來實現數值計算，這裡最核心的概念就是資料流圖，TensorFlow是以靜態圖（這裡不強調其動態圖的特性）的方式來表達計算，那麼一旦計算模型以圖的方式表達完成，就要通過Session來驅動計算，整體示意如上圖所示，節點和邊構成了你的計算模型，而實際計算時資料(Tensor)沿著圖的邊被驅動著進行計算從而流動起來，這也形象的表示了TensorFlow=Tensor+Flow。因此TensorFlow程式就可以分為兩個階段：

階段一：組裝一個計算圖，這裡只是用TF的api來表達計算模型，生成的是一個靜態圖，圖由計算的節點以及節點之間的連線表示，這個階段只是靜態的表示了計算，因此得不到任何實際的計算值。
階段二：通過一個Session（會話）來執行計算，這裡可以計算某個節點，而這個節點所依賴的父節點都會被驅動先行執行。

比如我們想從下圖所示的資料(X,Y)中學習一個線性關係y=w*x+b

TensorFlow: 薛定諤的管道

對於這樣一個機器學習任務，一般分為測試過程和訓練過程，測試過程一般比較簡單，這裡我們介紹如何使用TensorFlow來實現訓練過程，對於機器學習模型的訓練過程的一般可以如下面流程圖所示：

TensorFlow: 薛定諤的管道

具體步驟為：

1. 定義輸入和輸出標籤

2. 定義模型引數

3. 初始化模型引數

4. 基於輸入和模型引數，由模型的推理過程計算模型的預測結果

5. 基於模型的預測結果和標籤值，由損失函式來計算loss

6. 優化器通過更新引數來最小化loss

7. 不斷重複4-6直到迭代次數達到或者loss低於設定的閾值

使用TensorFlow來完成以上計算時，我們需要：

1）使用靜態圖的方式表達上面的計算過程（對應階段一）

2）使用Session(會話)來驅動上面的計算（對應階段二）

可以如下面程式碼所示，

TensorFlow: 薛定諤的管道

所有我們想要進行的計算都需要在階段一進行表達，如我們需要進行模型初始化這樣一個計算過程，那麼我們需要在階段一構造一個init操作節點，我們需要最小化loss,更新模型引數，我們可以構造一個train_op操作節點，每個計算對應計算圖中的一個計算節點，一旦計算圖構建完成，我們就可以在階段二過程通過執行這個節點來進行實際的計算如sess.run(init)，sess.run(train_op)。由此通過階段一階段二兩部分程式完成我們想要的計算邏輯，學習到的線性模型如下圖所示。

TensorFlow: 薛定諤的管道

正是因為TF這種graph和session兩階段的劃分，導致我們在除錯TF的時候也會分為兩個階段：

1. 錯誤發生在組裝圖部分。這裡TF會進行型別檢測，以及shape推理，所以一般dtype和shape相關的錯誤會與這一部分程式碼相關。

2. 錯誤發生在執行圖部分。這裡TF會進行執行時的計算，所以NaN等問題會發生在這個階段。

薛定諤的《半條命3》
2019-08-12
從薛定諤的貓聊到 Event loop
2019-04-03
OOP
道不盡的傳聞，與薛定諤的《寂靜嶺》
2021-07-15
《死亡擱淺》如何成了“薛定諤的貓”？一個小島秀夫式的烏托邦
2020-01-17
年年出妖事，一例由JSON解析導致的"薛定諤BUG"排查過程記錄
2022-05-07
JSON
使用 Google Cloud 上的 tf.Transform 對 TensorFlow 管道模式進行預處理
2019-03-04
GoCloudORM模式
使用Spring Boot設定GitLab CI/CD管道 - Marcus
2022-03-05
Spring BootGitlab
介紹 Linux 中的管道和命名管道
2018-09-12
Linux
管道的學習
2024-05-25
管道 |
2019-01-23
【tf.keras】tf.keras使用tensorflow中定義的optimizer
2019-06-06
Keras
angular 管道
2019-03-11
Angular
【linux】管道！！！
2018-03-12
Linux
redis管道
2023-12-05
Redis
Filter管道
2024-08-31
Filter
Linux 管道
2018-04-19
Linux
[Linux]管道
2024-12-03
Linux
演算法鏈與管道（上）：建立管道
2022-06-02
演算法
Redis管道技術的使用
2019-04-16
Redis
管道流間的通訊
2021-11-18
pytorch和tensorflow的愛恨情仇之定義可訓練的引數
2020-10-06
PyTorch
tensorflow的各種坑 tensorflow1.x 與 tensorflow2.x
2024-04-20
我的TensorFlow
2019-02-26
速度不夠，管道來湊——Redis管道技術
2019-04-30
Redis
Linux中的管道是什麼?管道與共享記憶體的區別有哪些？
2023-01-05
Linux記憶體
mongodb 聚合管道
2018-09-24
MongoDB
windows命名管道
2018-03-14
Windows
管道系統
2024-11-07
Linux管道符
2024-07-03
Linux
Linux 之管道
2020-12-10
Linux
OpenCL中的管道cl::Pipe的使用
2024-06-06
Tensorflow教程（2）Tensorflow的常用函式介紹
2019-07-14
函式
Linux 的程式間通訊：管道
2019-03-06
Linux
Angular 自定義管道 pipes 的使用
2019-12-18
Angular
Tensorflow1.x 與 Tensorflow2.0 的區別
2020-03-02
SciTech-BigDataAIML-TensorFlow-Model的編譯：設定(LossFunction+Optimizer+Metrics)與編譯
2024-05-11
AI編譯Function
netty 管道傳遞
2018-06-20
Netty
AngularJS 4(五)【管道】
2018-08-24
AngularJS

TensorFlow: 薛定諤的管道

相關文章