TensorFlow推出模型優化工具包，可將模型壓縮75%

機器之心發表於2018-09-20

原文網址 : http://www.jiqizhixin.com/articles/2018-09-20-7

近日，TensorFlow 推出了一款新的模型優化工具包。利用該該工具包中的技術可以將模型壓縮 75%，最大可將速度提升到原來的 3 倍。

新手和熟練的開發者都能利用這套工具包中的技術來優化待部署和執行的機器學習模型。預計該工具包中的技術將有助於優化所有 TensorFlow 模型以進行部署，但它對於那些為記憶體緊張、功率和儲存受限的裝置提供模型的 TensorFlow Lite 開發人員來說幫助最大。

TensorFlow Lite 相關資訊連結：https://www.tensorflow.org/mobile/tflite/。

TensorFlow推出模型優化工具包，可將模型壓縮75%

優化模型以減少尺寸、延遲和功耗，使準確率損失不明顯

新增的第一項支援技術是對 TensorFlow Lite 轉換工具的訓練後量化（post-training quantization）。對於相關的機器學習模型，利用該技術可以將模型壓縮到原來的 1/4，並將速度提升到原來的 3 倍。

開發者可以通過量化模型減少能耗。這點對於在邊緣裝置中部署（不侷限於手機）非常有用。

實現訓練後量化

訓練後量化技術是 TensorFlow Lite 轉換工具的一部分。上手非常簡單：建立 TensorFlow 模型之後，開發者可以簡單地實現 TensorFlow Lite 轉換工具中的「post_training_quantize」標記。假設這一儲存的模型儲存在 saved_model_dir 中，則可以生成量化的 tflite flatbuffer：

converter=tf.contrib.lite.TocoConverter.from_saved_model(saved_model_dir)
converter.post_training_quantize=True
tflite_quantized_model=converter.convert()
open(“quantized_model.tflite”, “wb”).write(tflite_quantized_model)

TensorFlow 提供了相關教程，深入解析如何做到這一點。未來的目標是將這種技術納入通用的 TensorFlow 工具中，以便將其部署在目前沒有 TensorFlow Lite 支援的平臺上。

教程連結：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/tutorials/post_training_quant.ipynb

訓練後量化的好處

模型縮小到原來的 1/4
主要由卷積層組成的模型執行速度提高了 10-50%。
基於 RNN 的模型得到了 3 倍的加速
由於減少了記憶體和計算需求，預計大多數模型將降低功耗。

下圖顯示一些模型尺寸減小，執行速度提高（使用單核的 Android Pixel 2 手機上進行的測量）。

TensorFlow推出模型優化工具包，可將模型壓縮75%

圖 1：模型大小比較：優化後的模型差不多縮小到原來的 1/4。

TensorFlow推出模型優化工具包，可將模型壓縮75%

圖 2：延時比較：優化後的模型速度是原來的 1.2—1.4 倍。

加速和模型尺寸減小對準確率的影響很小。一般對於手頭任務來說，已經較小的模型（如用於影象分類的 mobilenet v1）可能會損失更多的準確率。對於這些模型，TensorFlow 為其中的大部分提供預訓練的完全量化模型。

TensorFlow推出模型優化工具包，可將模型壓縮75%

圖 3：準確率比較：除了 mobilenets，優化後的模型準確率下降不明顯。

TensorFlow 期望在未來繼續改進結果，所以請參見模型優化指南，瞭解最新的測量結果。地址：https://www.tensorflow.org/performance/model_optimization

訓練後量化如何起作用

TensorFlow 通過將引數（即神經網路權重）的精度從訓練時的 32 位浮點表示降至小得多且高效的 8 位浮點數表示，來進行優化（也稱為量化）。詳細資訊請參見訓練後量化指南。地址：https://www.tensorflow.org/performance/post_training_quantization

這些優化將確保結果模型中精度降低的操作定義與使用固定和浮點數學混合的核心實現配對。這將在較低精度下快速執行最重的計算，但在較高精度下執行最敏感的計算，因此通常會導致任務很少甚至沒有最終準確率損失，但與純浮點執行相比，速度顯著加快。對於沒有匹配的「混合」核心的操作，或者工具包認為有必要的操作，它會將引數重新轉換為更高的浮點精度來執行。有關支援混合操作的列表，請參見訓練後量化頁面。

未來展望

TensorFlow 將繼續改進訓練後量化及簡化模型優化過程的其它技術上的工作。這些將整合到 TensorFlow 相關工作流程中，使其更加容易使用。

訓練後量化是 TensorFlow 正在開發的優化工具包下的第一個產品，該團隊希望得到來自開發者的相關反饋。

原文連結：https://medium.com/tensorflow/introducing-the-model-optimization-toolkit-for-tensorflow-254aca1ba0a3

TensorFlow推出模型最佳化工具包，可將模型壓縮75%
2018-09-20
模型
TensorFlow的新型模型優化工具包可使模型速度提高3倍
2018-09-26
模型優化
模型壓縮-模型蒸餾、模型剪枝、模型量化
2024-08-07
模型
BERT 模型壓縮方法
2020-03-02
模型
gltf-pipeline 壓縮glb模型
2024-11-26
模型
yolov5--4.0--模型壓縮
2021-03-17
YOLO模型
MLPerf世界紀錄技術分享：通過模型壓縮優化取得最佳效能
2022-06-09
模型優化
深度學習模型壓縮方法概述
2023-03-14
深度學習模型
使用mmdnn將MXNET轉成Tensorflow模型
2019-12-10
DNN模型
模型壓縮-剪枝演算法詳解
2023-02-22
模型演算法
如何將keras訓練的模型轉換成tensorflow lite模型
2018-08-21
Keras模型
TensorFlow筆記(5)——優化手寫數字識別模型之優化器
2018-12-12
筆記優化模型
騰訊 AI Lab提出自動化模型壓縮框架PocketFlow：將深度學習裝進口袋
2018-09-17
AI模型框架深度學習
大模型原理：遞迴、壓縮和模式匹配
2024-09-18
大模型遞迴模式
CNN 模型壓縮與加速演算法綜述
2019-01-02
CNN模型演算法
用TensorFlow實現ML模型並調優：每秒可做3億次預測
2021-09-23
模型
Facebook投放優化模型
2019-11-25
優化模型
編譯 TensorFlow 模型
2023-05-15
編譯模型
早餐｜第十七期 · 模型優化器對模型做了哪些優化
2020-09-27
模型優化
tensorflow模型持久化儲存和載入
2018-04-23
模型持久化
壓縮大型語言模型(LLMs):縮小10倍、效能保持不變
2024-09-01
模型
Redis儲存優化--小物件壓縮
2020-11-14
Redis優化物件
如何將法律法則轉化為可執行模型？ - brcommunity
2022-03-08
模型Unity
如何將法律法規轉化為可執行模型？ - brcommunity
2022-03-08
模型Unity
大模型應用曙光 - 10X壓縮技術
2024-09-25
大模型
Python 載入 TensorFlow 模型
2024-08-19
Python模型
知識蒸餾、輕量化模型架構、剪枝…幾種深度學習模型壓縮方法
2023-03-13
模型架構深度學習
HTTP前端效能優化(壓縮與快取)
2019-09-11
HTTP前端優化快取
【Go】使用壓縮檔案優化io (二)
2019-07-08
Go優化
【Go】使用壓縮檔案優化io (一)
2019-07-01
Go優化
【Go】使用壓縮檔案優化 io (一)
2019-07-01
Go優化
【TensorFlow】 TensorFlow-Slim影像分類模型庫
2021-09-09
模型
TVM 加速模型，優化推斷
2022-05-22
模型優化
[譯] TensorFlow 教程 – 07 Inception 模型
2019-02-28
模型
DSSM模型和tensorflow實現
2018-08-28
SSM模型
優雅且語義化的斷言之—將模型屬性斷言變為模型方法斷言
2022-04-21
模型
NeurIPS 2018 | 騰訊AI Lab詳解3大熱點：模型壓縮、機器學習及最優化演算法
2018-12-12
AI模型機器學習優化演算法
前端效能優化 --- 資源合併與壓縮
2018-08-29
前端優化

TensorFlow推出模型優化工具包，可將模型壓縮75%

相關文章