TensorFlow Serving: 高效能機器學習模型部署利器

dongai666發表於2024-10-09

原文網址 : https://www.cnblogs.com/dongai/p/18454765

serving
TensorFlow Serving簡介
TensorFlow Serving是一個專為生產環境設計的靈活、高效能機器學習模型服務系統。它主要處理機器學習的推理(inference)階段，負責管理訓練後模型的生命週期，並透過高效能的引用計數查詢表為客戶端提供版本化訪問。雖然TensorFlow Serving原生支援TensorFlow模型，但它的設計足夠靈活，可以輕鬆擴充套件以服務其他型別的模型和資料。

TensorFlow Serving架構

主要特性
TensorFlow Serving擁有許多強大的特性，使其成為機器學習模型部署的理想選擇：

多模型服務：能夠同時服務多個模型或同一模型的多個版本。
雙重API支援：同時提供gRPC和HTTP推理端點，滿足不同的整合需求。
無縫版本更新：支援部署新版本模型，無需更改任何客戶端程式碼。
灰度釋出與A/B測試：允許對新版本進行灰度釋出，以及對實驗性模型進行A/B測試。
低延遲：採用高效、低開銷的實現，為推理時間增加的延遲極小。
智慧排程：配備排程器，可將單個推理請求分組為批次，在GPU上聯合執行，並提供可配置的延遲控制。
多樣化服務：除了TensorFlow模型，還支援嵌入、詞彙表、特徵轉換，甚至非TensorFlow的機器學習模型。
快速上手：60秒部署TensorFlow模型
TensorFlow Serving提供了一種極其簡便的方式來部署模型。以下是一個快速示例，展示如何在60秒內使用Docker部署一個TensorFlow模型：

下載TensorFlow Serving Docker映象：

docker pull tensorflow/serving
克隆TensorFlow Serving倉庫：

git clone https://github.com/tensorflow/serving
設定demo模型路徑：

TESTDATA="$(pwd)/serving/tensorflow_serving/servables/tensorflow/testdata"
啟動TensorFlow Serving容器並開放REST API埠：

docker run -t --rm -p 8501:8501
-v "$TESTDATA/saved_model_half_plus_two_cpu:/models/half_plus_two"
-e MODEL_NAME=half_plus_two
tensorflow/serving &
使用predict API查詢模型：

curl -d '{"instances": [1.0, 2.0, 5.0]}'
-X POST http://localhost:8501/v1/models/half_plus_two:predict
這個簡單的示例展示了TensorFlow Serving的強大功能，只需幾個命令就能部署一個可用的機器學習模型服務。

深入理解：TensorFlow Serving的工作原理
SavedModel格式
TensorFlow Serving使用SavedModel格式來匯出和載入模型。SavedModel是一種語言中立、可恢復、封閉的序列化格式，使得高階系統和工具能夠生產、消費和轉換TensorFlow模型。

要使用TensorFlow Serving部署模型，首先需要從TensorFlow程式中匯出SavedModel。這個過程通常包括以下步驟：

定義模型架構
訓練模型
使用tf.saved_model.save()函式儲存模型
例如：

import tensorflow as tf

定義和訓練模型

model = tf.keras.Sequential([...])
model.compile(...)
model.fit(...)

儲存模型

tf.saved_model.save(model, '/path/to/saved_model')
模型版本管理
TensorFlow Serving的一個關鍵特性是其強大的版本管理能力。它允許同時載入多個版本的模型，並能夠平滑地切換between不同版本。這種設計使得A/B測試和灰度釋出變得異常簡單。

版本管理的工作原理如下：

每個SavedModel都被賦予一個唯一的版本號。
TensorFlow Serving維護一個版本策略，決定哪些版本應該被載入和服務。
客戶端可以請求特定版本的模型，或使用預設版本。
批處理和排程
為了最佳化效能，TensorFlow Serving實現了智慧的批處理和排程機制。這允許系統將多個獨立的推理請求組合成批次，特別是在使用GPU時，這可以顯著提高吞吐量。

批處理排程器考慮以下因素：

批次大小
超時時間
佇列容量
透過調整這些引數，使用者可以在延遲和吞吐量之間找到最佳平衡點。

部署最佳實踐
在生產環境中部署TensorFlow Serving時，以下是一些最佳實踐：

使用Docker：Docker提供了一種簡單且可重複的方式來部署TensorFlow Serving。官方提供了CPU和GPU版本的Docker映象。

監控和日誌：利用TensorFlow Serving的監控API來跟蹤模型效能和系統健康狀況。配置適當的日誌級別以便於除錯和分析。

效能最佳化：

使用saved_model_cli工具分析模型，確保它被正確最佳化。
考慮使用TensorRT進行推理最佳化，特別是在GPU環境中。
調整批處理引數以平衡延遲和吞吐量。
安全性：

在生產環境中啟用TLS/SSL加密。
實施適當的認證和授權機制。
定期更新TensorFlow Serving到最新版本，以獲取安全補丁。
高可用性：

使用負載均衡器部署多個TensorFlow Serving例項。
實施健康檢查和自動恢復機制。
模型更新策略：

實施藍綠部署或金絲雀釋出策略進行模型更新。
使用TensorFlow Serving的版本控制功能進行A/B測試。
擴充套件TensorFlow Serving
TensorFlow Serving的模組化架構使其具有極強的可擴充套件性。開發者可以透過以下方式擴充套件其功能：

建立自定義Servable：Servable是TensorFlow Serving中可以執行計算的基本單位。透過建立自定義Servable，可以支援新的模型型別或資料格式。

實現自定義Source：Source負責管理Servable的生命週期。自定義Source可以實現特定的版本管理策略或與特定儲存系統整合。

開發自定義Manager：Manager協調多個Source和Loader。透過自定義Manager，可以實現複雜的載入和服務策略。

擴充套件API：可以透過擴充套件gRPC或HTTP API來新增新的功能或支援自定義的請求/響應格式。

結語
TensorFlow Serving作為一個強大、靈活的機器學習模型服務系統，為生產環境中的模型部署提供了一個理想的解決方案。它不僅簡化了部署過程，還提供了諸如版本管理、批處理最佳化等高階功能，使得在實際應用中管理和擴充套件機器學習服務變得更加容易。

隨著機器學習在各行各業的廣泛應用，TensorFlow Serving無疑將在未來扮演越來越重要的角色。無論是初創公司還是大型企業，都可以利用TensorFlow Serving來構建可靠、高效的機器學習服務基礎設施，從而更好地將AI的力量轉化為實際的業務價值。
文章連結：www.dongaigc.com/a/tensorflow-serving-high-performance-ml
https://www.dongaigc.com/a/tensorflow-serving-high-performance-ml
www.dongaigc.com/p/tensorflow/serving
https://www.dongaigc.com/p/tensorflow/serving

使用 TensorFlow Serving 和 Docker 快速部署機器學習服務
2019-03-04
Docker機器學習
TensorFlow Serving
2021-04-15
tensorflow機器學習模型的跨平臺上線
2018-07-01
機器學習模型
基於TensorFlow Serving的深度學習線上預估
2018-10-18
深度學習
TensorFlow模型部署到伺服器---TensorFlow2.0
2021-08-01
模型伺服器
【機器學習No.1】Tensorflow智慧之別衣帽種類模型
2019-03-26
機器學習模型
機器學習模型
2024-03-30
機器學習模型
Kubernetes入門(四)——如何在Kubernetes中部署一個可對外服務的Tensorflow機器學習模型
2020-09-19
機器學習模型
六條規則讓你更快部署機器學習模型！
2018-11-20
機器學習模型
使用pmml實現跨平臺部署機器學習模型
2021-11-20
機器學習模型
前端如何學習機器學習之TensorFlow.js
2019-03-03
前端機器學習JS
TensorFlow Hub：探索機器學習元件化
2018-12-13
機器學習元件化
機器學習模型部署--打通前後端任督二脈
2019-04-23
機器學習模型後端
如何管理機器學習模型
2019-01-12
機器學習模型
欺騙機器學習模型
2018-04-06
機器學習模型
機器學習導圖系列（5）：機器學習模型及神經網路模型
2019-04-11
機器學習模型神經網路
TensorFlow系列專題（二）：機器學習基礎
2018-11-05
機器學習
TensorFlow系列專題（一）：機器學習基礎
2018-11-05
機器學習
面向機器智慧的TensorFlow實戰4：機器學習基礎
2018-05-25
機器學習
【機器學習】--隱語義模型
2018-06-12
機器學習模型
機器學習——決策樹模型
2023-12-26
機器學習模型
機器學習之模型選擇
2020-02-14
機器學習模型
機器學習之模型診斷
2020-02-14
機器學習模型
機器學習之模型評估
2019-06-21
機器學習模型
從預處理到部署：如何使用Lore快速構建機器學習模型
2018-03-13
機器學習模型
機器學習模型python線上服務部署的兩種例項
2020-09-22
機器學習模型Python
使用pmml跨平臺部署機器學習模型Demo——房價預測
2021-11-21
機器學習模型
Docker部署深度學習模型
2024-06-05
Docker深度學習模型
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰
2018-11-26
機器學習筆記
機器學習系列-tensorflow-02-基本操作運算
2018-10-30
機器學習
從模型到部署，教你如何用Python構建機器學習API服務
2024-04-08
模型Python機器學習API
害怕部署機器學習模型？這裡有一篇手把手教程
2019-11-21
機器學習模型
TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.js
2019-03-03
JavaScript機器學習框架JS
【TensorFlow篇】--Tensorflow框架初始，實現機器學習中多元線性迴歸
2018-03-27
框架機器學習
機器學習【模型，策略，演算法】
2024-11-27
機器學習模型演算法
《機器學習_05_線性模型_最大熵模型》
2020-05-18
機器學習模型熵
TensorFlow.NET機器學習入門【8】採用GPU進行學習
2021-12-31
機器學習GPU
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記1 — 機器學習基礎知識簡介
2018-11-20
機器學習筆記

TensorFlow Serving: 高效能機器學習模型部署利器

定義和訓練模型

儲存模型

相關文章