Google 開發者大會 (Google Developer Days,簡稱 GDD) 是展示 Google 最新開發者產品和平臺的全球盛會,旨在幫助你快速開發優質應用,發展和留住活躍使用者群,充分利用各種工具獲得更多收益。2018 Google 開發者大會於 9 月 20 日和 21 日於上海舉辦。?Google 開發者大會 2018 掘金專題
2018 年 9 月 21 日 丘天豪(Google Brain 軟體工程師)帶來一場《使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習》的演講,本文將對演講做一個回顧。
TensorFlow Extended
data:image/s3,"s3://crabby-images/6a06d/6a06d1da05e2ccda82ad2505beb57287d76321e3" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
data:image/s3,"s3://crabby-images/f8fdc/f8fdce108bf348358a19274a410a94bfba14d926" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
TensorFlow Extended 平臺的組成結構如上圖所示,下面將根據 Google 開源的 四個部分進行介紹。
資料轉換 (TensorFlow Trainsform)
data:image/s3,"s3://crabby-images/8f535/8f5355b990b8972512c242b2fb91f7e47aee105f" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
在使用資料集之前,往往需要對資料進行轉換,TFT 允許將資料轉換成 TF 計算圖,同時也可以定義一些特殊的轉換來表達特殊的特徵。生成的 TF 計算圖是完成密封的,包含所有的特徵值資訊,這也就意味著可以應用於訓練和部署中。這個是十分重要的一點,在生產環境中,有可能我們訓練和部署所使用的語言和路徑是不相同的,而 TF 計算圖是完成密封的,很好的解決了這個問題。
示例:
計程車給小費例項
data:image/s3,"s3://crabby-images/08f01/08f010702c224c10d383ee1f53416deec133576a" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
data:image/s3,"s3://crabby-images/6cb4d/6cb4d7af4254e294332695a68a040e2793154f0a" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
GitHub:github.com/tensorflow/…
模型訓練 (Estimators or Keras)
使用 TensorFlow Estimators 進行模型訓練
data:image/s3,"s3://crabby-images/28d5b/28d5b1171b0e8e1211b4c7b6e0dd7f449ca31e0a" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
訓練好的模型會以 SavedModel
形式輸出。
data:image/s3,"s3://crabby-images/78ed3/78ed37d8e2fcd7446d7d5530d6a9f8864787ac75" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
使用 tf.Keras 進行模型訓練
data:image/s3,"s3://crabby-images/03714/03714be4ae0244e1fe48a5548646897c9ecfac89" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
模型評估和驗證(TensorFlow Model Analysis)
在完成模型訓練之後,往往需要重新編寫程式碼對模型進行評估和驗證。TFMA 就是為了解決這個問題出現。
data:image/s3,"s3://crabby-images/c4f77/c4f77ca1c01dee484aaef64a3fc618c6a6752661" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
在執行上圖所示程式碼後,會出現如下圖這樣的圖形介面,更加直觀的對模型就行評估。
data:image/s3,"s3://crabby-images/36270/36270cea319f07fc2dec000417fe0557e803a617" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
GitHub:github.com/tensorflow/…
模型部署 (TensorFlow Serving)
data:image/s3,"s3://crabby-images/90965/90965782443fba0cc85713bab499151bcab8a04d" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
在使用 TensorFlow Serving 部署模型之後,使用 Serving 介面即可進行訪問。
data:image/s3,"s3://crabby-images/1fcb4/1fcb48cef622c0dfe9b0c19200eb7a2448d550a6" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
GitHub:github.com/tensorflow/…
資料分析和驗證 (TensorFlow Data Validation)
data:image/s3,"s3://crabby-images/8206a/8206a499dae8b5c003fe247bfc0558a5d624b5e6" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
Data Validation 模組組成如下:
data:image/s3,"s3://crabby-images/abc8e/abc8eeda33ebe6b1fba1fbabffad4351f613ffc7" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
計算統計資料與統計資料視覺化
data:image/s3,"s3://crabby-images/b7662/b76629b874e2e0d695306a3001a484da72ed6342" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
推導初始 Schema
data:image/s3,"s3://crabby-images/d5c6f/d5c6f53b1158189c3d37850f49258df346fc34ec" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
資料驗證
data:image/s3,"s3://crabby-images/a54c8/a54c8238c9c7f454feccd672a94794f55dcd6511" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
data:image/s3,"s3://crabby-images/7b5e5/7b5e5bf61fbeac39cce581edd7b05f2ec5fc998d" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
data:image/s3,"s3://crabby-images/148ec/148ec779a1f47bde28c89e7861e6903297f57084" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
訓練/線上資料偏差檢測
data:image/s3,"s3://crabby-images/b8c9e/b8c9e7fba0cf224ebaa0fa4446bd3e490b40017d" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
GitHub:github.com/tensorflow/…
總結
實際生產環境中使用 TFX 流程如下:
data:image/s3,"s3://crabby-images/d2ce1/d2ce1e2343903a53712d75c1b55ae5cd930977cb" alt="使用 TensorFlow Extended (TFX) 在生產環境中部署機器學習 丨 Google 開發者大會 2018"
論文:TFX: A TensorFlow-Based Production-Scale Machine Learning Platform,KDD(2017)
以上就是本次演講的全部內容,希望對大家有所幫助。
閱讀更多 Google 開發者大會 2018 技術乾貨