『深度長文』Tensorflow程式碼解析（一）

深度学习大讲堂發表於2016-11-11

原文網址 : https://www.jiqizhixin.com/articles/2017-10-31-2

摘要

2015年11月9日，Google釋出深度學習框架TensorFlow並宣佈開源，並迅速得到廣泛關注，在圖形分類、音訊處理、推薦系統和自然語言處理等場景下都被大面積推廣。TensorFlow系統更新快速，官方文件教程齊全，上手快速且簡單易用，支援Python和C++介面。本文依據對Tensorflow（簡稱TF）白皮書[1]、TF Github[2]和TF官方教程[3]的理解，從系統和程式碼實現角度講解TF的內部實現原理。以Tensorflow r0.8.0為基礎，本文由淺入深的闡述Tensor和Flow的概念。先介紹了TensorFlow的核心概念和基本概述，然後剖析了OpKernels模組、Graph模組、Session模組。

1. TF系統架構

1.1 TF依賴檢視

TF的依賴檢視如圖 1.1所示[4]，描述了TF的上下游關係鏈。

『深度長文』Tensorflow程式碼解析（一）

圖 1.1 TensorFlow依賴檢視

TF託管在github平臺，有google groups和contributors共同維護。

TF提供了豐富的深度學習相關的API，支援Python和C/C++介面。

TF提供了視覺化分析工具Tensorboard，方便分析和調整模型。

TF支援Linux平臺，Windows平臺，Mac平臺，甚至手機移動裝置等各種平臺。

1.2 TF系統架構

圖 1.2是TF的系統架構，從底向上分為裝置管理和通訊層、資料操作層、圖計算層、API介面層、應用層。其中裝置管理和通訊層、資料操作層、圖計算層是TF的核心層。

『深度長文』Tensorflow程式碼解析（一）

圖 1.2 TF系統架構

底層裝置通訊層負責網路通訊和裝置管理。裝置管理可以實現TF裝置異構的特性，支援CPU、GPU、Mobile等不同裝置。網路通訊依賴gRPC通訊協議實現不同裝置間的資料傳輸和更新。

第二層是Tensor的OpKernels實現。這些OpKernels以Tensor為處理物件，依賴網路通訊和裝置記憶體分配，實現了各種Tensor操作或計算。Opkernels不僅包含MatMul等計算操作，還包含Queue等非計算操作，這些將在第5章Kernels模組詳細介紹。

第三層是圖計算層（Graph），包含本地計算流圖和分散式計算流圖的實現。Graph模組包含Graph的建立、編譯、優化和執行等部分，Graph中每個節點都是OpKernels型別表示。關於圖計算將在第6章Graph模組詳細介紹。

第四層是API介面層。Tensor C API是對TF功能模組的介面封裝，便於其他語言平臺呼叫。

第四層以上是應用層。不同程式語言在應用層通過API介面層呼叫TF核心功能實現相關實驗和應用。

1.3 TF程式碼目錄組織

圖 1.3是TF的程式碼結構檢視，下面將簡單介紹TF的目錄組織結構。

『深度長文』Tensorflow程式碼解析（一）

圖 1.3 TF程式碼目錄組織結構

Tensorflow/core目錄包含了TF核心模組程式碼。

public: API介面標頭檔案目錄，用於外部介面呼叫的API定義，主要是session.h 和tensor_c_api.h。

client: API介面實現檔案目錄。

platform: OS系統相關介面檔案，如file system, env等。

protobuf: 均為.proto檔案，用於資料傳輸時的結構序列化.

common_runtime: 公共執行庫，包含session, executor, threadpool, rendezvous, memory管理, 裝置分配演算法等。

distributed_runtime: 分散式執行模組，如rpc session, rpc master, rpc worker, graph manager。

framework: 包含基礎功能模組，如log, memory, tensor

graph: 計算流圖相關操作，如construct, partition, optimize, execute等

kernels: 核心Op，如matmul, conv2d, argmax, batch_norm等

lib: 公共基礎庫，如gif、gtl(google模板庫)、hash、histogram等。

ops: 基本ops運算，ops梯度運算，io相關的ops，控制流和資料流操作

Tensorflow/stream_executor目錄是平行計算框架，由google stream executor團隊開發。

Tensorflow/contrib目錄是contributor開發目錄。

Tensroflow/python目錄是python API客戶端指令碼。

Tensorflow/tensorboard目錄是視覺化分析工具，不僅可以模型視覺化，還可以監控模型引數變化。

third_party目錄是TF第三方依賴庫。

eigen3: eigen矩陣運算庫，TF基礎ops呼叫

gpus: 封裝了cuda/cudnn程式設計庫

2. TF核心概念

TF的核心是圍繞Graph展開的，簡而言之，就是Tensor沿著Graph傳遞閉包完成Flow的過程。所以在介紹Graph之前需要講述一下符號程式設計、計算流圖、梯度計算、控制流的概念。

2.1 Tensor

在數學上，Matrix表示二維線性對映，Tensor表示多維線性對映，Tensor是對Matrix的泛化，可以表示1-dim、2-dim、N-dim的高維空間。圖 2 1對比了矩陣乘法（Matrix Product）和張量積（Tensor Contract），可以看出Tensor的泛化能力，其中張量積運算在TF的MatMul和Conv2D運算中都有用到，

『深度長文』Tensorflow程式碼解析（一）

圖 2.1 Tensor contract

Tensor在高維空間數學運算比Matrix計算複雜，計算量也非常大，加速張量並行運算是TF優先考慮的問題，如add, contract, slice, reshape, reduce, shuffle等運算。

TF中Tensor的維數描述為階，數值是0階，向量是1階，矩陣是2階，以此類推，可以表示n階高維資料。

TF中Tensor支援的資料型別有很多，如tf.float16, tf.float32, tf.float64, tf.uint8, tf.int8, tf.int16, tf.int32, tf.int64, tf.string, tf.bool, tf.complex64等，所有Tensor運算都使用泛化的資料型別表示。

TF的Tensor定義和運算主要是呼叫Eigen矩陣計算庫完成的。TF中Tensor的UML定義如圖 2.2。其中TensorBuffer指標指向Eigen::Tensor型別。其中，Eigen::Tensor[5][6]不屬於Eigen官方維護的程式，由貢獻者提供文件和維護，所以Tensor定義在Eigen unsupported模組中。

『深度長文』Tensorflow程式碼解析（一）

圖 2.2 Tensor資料結構定義

圖 2.2中，Tensor主要包含兩個變數m_data和m_dimension，m_data儲存了Tensor的資料塊，T是泛化的資料型別，m_dimensions儲存了Tensor的維度資訊。

Eigen::Tensor的成員變數很簡單，卻支援非常多的基本運算，再借助Eigen的加速機制實現快速計算，參考章節3.2。Eigen::Tensor主要包含了

一元運算（Unary），如sqrt、square、exp、abs等。

二元運算（Binary），如add，sub，mul，div等

選擇運算（Selection），即if / else條件運算

歸納運算（Reduce），如reduce_sum， reduce_mean等

幾何運算（Geometry），如reshape，slice，shuffle，chip，reverse，pad，concatenate，extract_patches，extract_image_patches等

張量積（Contract）和卷積運算（Convolve）是重點運算，後續會詳細講解。

2.2 符號程式設計

程式設計模式通常分為指令式程式設計（imperative style programs）和符號式程式設計（symbolic style programs）。

指令式程式設計容易理解和除錯，命令語句基本沒有優化，按原有邏輯執行。符號式程式設計涉及較多的嵌入和優化，不容易理解和除錯，但執行速度有同比提升。

這兩種程式設計模式在實際中都有應用，Torch是典型的命令式風格，caffe、theano、mxnet和Tensorflow都使用了符號式程式設計。其中caffe、mxnet採用了兩種程式設計模式混合的方法，而Tensorflow是完全採用了符號式程式設計，Theano和Tensorflow的程式設計模式更相近。

指令式程式設計是常見的程式設計模式，程式語言如python/C++都採用指令式程式設計。指令式程式設計明確輸入變數，並根據程式邏輯逐步運算，這種模式非常在除錯程式時進行單步跟蹤，分析中間變數。舉例來說，設A=10, B=10，計算邏輯：

『深度長文』Tensorflow程式碼解析（一）

第一步計算得出C=100，第二步計算得出D=101，輸出結果D=101。

符號式程式設計將計算過程抽象為計算圖，計算流圖可以方便的描述計算過程，所有輸入節點、運算節點、輸出節點均符號化處理。計算圖通過建立輸入節點到輸出節點的傳遞閉包，從輸入節點出發，沿著傳遞閉包完成數值計算和資料流動，直到達到輸出節點。這個過程經過計算圖優化，以資料（計算）流方式完成，節省記憶體空間使用，計算速度快，但不適合程式除錯，通常不用於程式語言中。舉上面的例子，先根據計算邏輯編寫符號式程式並生成計算圖

『深度長文』Tensorflow程式碼解析（一）

其中A和B是輸入符號變數，C和D是運算子號變數，compile函式生成計算圖F，如圖 2.3所示。

『深度長文』Tensorflow程式碼解析（一）

圖 2.3 符號程式設計的正向計算圖

最後得到A=10, B=10時變數D的值，這裡D可以複用C的記憶體空間，省去了中間變數的空間儲存。

『深度長文』Tensorflow程式碼解析（一）

圖 2.4是TF中的計算流圖，C=F(Relu(Add(MatMul(W, x), b)))，其中每個節點都是符號化表示的。通過session建立graph，在呼叫session.run執行計算。

『深度長文』Tensorflow程式碼解析（一）

圖 2.4 TF符號計算圖

和目前的符號語言比起來，TF最大的特點是強化了資料流圖，引入了mutation的概念。這一點是TF和包括Theano在內的符號程式設計框架最大的不同。所謂mutation，就是可以在計算的過程更改一個變數的值，而這個變數在計算的過程中會被帶入到下一輪迭代裡面去。

Mutation是機器學習優化演算法幾乎必須要引入的東西（雖然也可以通過immutable replacement來代替，但是會有效率的問題）。 Theano的做法是引入了update statement來處理mutation。TF選擇了純符號計算的路線，並且直接把更新引入了資料流圖中去。從目前的白皮書看還會支援條件和迴圈。這樣就幾乎讓TF本身成為一門獨立的語言。不過這一點會導致最後的API設計和使用需要特別小心，把mutation 引入到資料流圖中會帶來一些新的問題，比如如何處理寫與寫之間的依賴。[7]

2.3 梯度計算

梯度計算主要應用在誤差反向傳播和資料更新，是深度學習平臺要解決的核心問題。梯度計算涉及每個計算節點，每個自定義的前向計算圖都包含一個隱式的反向計算圖。從資料流向上看，正向計算圖是資料從輸入節點到輸出節點的流向過程，反向計算圖是資料從輸出節點到輸入節點的流向過程。

圖 2.5是2.2節中圖 2.3對應的反向計算圖。圖中，由於C=A*B，則dA=B*dC, dB=A*dC。在反向計算圖中，輸入節點dD，輸出節點dA和dB，計算表示式為dA=B*dC=B*dD, dB=A*dC=A*dD。每一個正向計算節點對應一個隱式梯度計算節點。

『深度長文』Tensorflow程式碼解析（一）

圖 2.5 符號程式設計的反向計算圖

反向計算限制了符號程式設計中記憶體空間複用的優勢，因為在正向計算中的計算資料在反向計算中也可能要用到。從這一點上講，粗粒度的計算節點比細粒度的計算節點更有優勢，而TF大部分為細粒度操作，雖然靈活性很強，但細粒度操作涉及到更多的優化方案，在工程實現上開銷較大，不及粗粒度簡單直接。在神經網路模型中，TF將逐步側重粗粒度運算。

2.4 控制流

TF的計算圖如同資料流一樣，資料流向表示計算過程，如圖 2.6。資料流圖可以很好的表達計算過程，為了擴充套件TF的表達能力，TF中引入控制流。

『深度長文』Tensorflow程式碼解析（一）

圖 2.6 Graph的資料流

在程式語言中，if…else…是最常見的邏輯控制，在TF的資料流中也可以通過這種方式控制資料流向。介面函式如下，pred為判別表示式，fn1和fn2為運算表示式。當pred為true是，執行fn1操作；當pred為false時，執行fn2操作。

『深度長文』Tensorflow程式碼解析（一）

TF還可以協調多個資料流，在存在依賴節點的場景下非常有用，例如節點B要讀取模型引數θ更新後的值，而節點A負責更新引數θ，則節點B必須等節點A完成後才能執行，否則讀取的引數θ為更新前的數值，這時需要一個運算控制器。介面函式如下，tf.control_dependencies函式可以控制多個資料流執行完成後才能執行接下來的操作，通常與tf.group函式結合使用。

『深度長文』Tensorflow程式碼解析（一）

TF支援的控制運算元有Switch、Merge、Enter、Leave和NextIteration等。

TF不僅支援邏輯控制，還支援迴圈控制。TF使用和MIT Token-Tagged machine相似的表示系統，將迴圈的每次迭代標記為一個tag，迭代的執行狀態標記為一個frame，但迭代所需的資料準備好的時候，就可以開始計算，從而多個迭代可以同時執行。

原文連結：https://mp.weixin.qq.com/s/wC2EKp14lShUf5tAIBg5ow

深度長文解析SpringWebFlux響應式框架15個核心元件原始碼
2024-07-04
SpringWebUX框架元件原始碼
Python TensorFlow深度學習迴歸程式碼：DNNRegressor
2023-02-02
Python深度學習DNN
長文回顧和深度解析Supercell十年來的成就
2021-03-19
哪一個深度學習框架增長最迅猛？TensorFlow 還是 PyTorch？
2019-04-11
深度學習框架PyTorch
【長文剖析】Spring Cloud OAuth 生成Token 原始碼解析
2019-04-15
SpringCloudOAuth原始碼
SnapHelper原始碼深度解析
2019-01-19
原始碼
Vuex 原始碼深度解析
2018-09-10
Vue原始碼
OkHttp原始碼深度解析
2020-03-25
HTTP原始碼
tensorflow原始碼解析之framework-resource
2021-09-09
原始碼Framework
tensorflow原始碼解析之framework-allocator
2021-09-09
原始碼Framework
[原始碼解析] TensorFlow 分散式之 ClusterCoordinator
2022-05-21
原始碼分散式
[原始碼解析] TensorFlow 分散式之 MirroredStrategy
2022-04-19
原始碼分散式
深度長文整理-Redis進階
2020-09-19
Redis
[譯] 哪一個深度學習框架增長最迅猛？TensorFlow 還是 PyTorch？
2019-04-11
深度學習框架PyTorch
一文帶你深度解析MySQL 8.0事務提交原理
2024-08-13
MySql
10K+，深度學習論文、程式碼最全彙總！一鍵收藏
2019-03-18
深度學習
一文解析：低程式碼與無程式碼的相同之處、不同之處以及如何選？
2021-02-01
[深度學習]人臉檢測-Tensorflow2.x keras程式碼實現
2020-10-22
深度學習Keras
React Hooks原始碼深度解析
2023-03-16
ReactHook原始碼
微信小程式深度解析
2018-04-12
微信小程式
[原始碼解析] TensorFlow 之分散式變數
2022-04-14
原始碼分散式變數
深度長文：NLP的巨人肩膀（上）
2018-12-10
Netty原始碼深度解析(九)-編碼
2018-12-03
Netty原始碼
【深度學習】TensorFlow實現線性迴歸，程式碼演示。全md文件筆記（程式碼文件已分享）
2024-02-27
深度學習筆記
知否？知否？一文看懂深度文字分類之DPCNN原理與程式碼
2019-01-26
文字分類CNN
[原始碼解析] TensorFlow 分散式環境(5) --- Session
2022-03-28
原始碼分散式Session
[原始碼解析] TensorFlow 分散式環境(4) --- WorkerCache
2022-03-23
原始碼分散式
萬字長文+圖文並茂+全面解析微前端框架 qiankun 原始碼 - qiankun 篇
2020-04-06
前端框架原始碼
RecyclerView用法和原始碼深度解析
2019-02-18
View原始碼
KubeSphere 後端原始碼深度解析
2022-01-21
後端原始碼
Spring5原始碼深度解析(一)之理解Configuration註解
2019-06-26
Spring原始碼
Spring原始碼深度解析(郝佳)-學習-原始碼解析-Spring MVC
2020-12-30
Spring原始碼MVC
[原始碼解析] TensorFlow 分散式之 ParameterServerStrategy V2
2022-05-14
原始碼分散式Server
[原始碼解析] TensorFlow 分散式之 ParameterServerStrategy V1
2022-05-08
原始碼分散式Server
[原始碼解析] TensorFlow 分散式 DistributedStrategy 之基礎篇
2022-04-12
原始碼分散式
深度解析 create-react-app 原始碼
2018-06-12
ReactAPP原始碼
yolov5 head原始碼深度解析
2021-03-09
YOLO原始碼
深度學習趣談：什麼是遷移學習？（附帶Tensorflow程式碼實現）
2020-07-17
深度學習遷移學習
萬字長文深度剖析 RocketMQ 設計原理
2022-05-13
MQ

『深度長文』Tensorflow程式碼解析（一）

相關文章