MLSys 2020提前看：多面瞭解機器學習系統標準、加速方法和應用場景

機器之心分析師發表於2020-03-30

原文網址 : https://www.jiqizhixin.com/articles/2020-03-30-5

機器學習本質上是一系列的數值計算。當需要計算的資料量很大或者計算模型很大時，就需要設計一個合適的平臺來進行這種計算。機器學習系統就是針對此方面的研究，目的在於開發一類特殊的系統，用於支援和部署機器學習模型。MLSys 會議正是來解決機器學習和計算機系統之間的交叉問題。首屆會議於 2018 年在史丹佛舉辦，吸引了學界和業界的廣泛關注，會議主要研究（1）設計支援機器學習的軟體系統；（2）設計硬體系統；（3）設計系統以滿足精度以外的其他需求，諸如隱私，安全，公平性等。

在本篇提前看中，我們從不同的角度選擇三篇文章。其中，第一篇文章對機器學習系統制定了一套具備一般性的工業衡量標準，第二篇文章從模型部署層面對機器學習模型進行加速，主要解決瓶頸是特徵計算的問題，第三篇文章則針對一個特定應用場景——大量依賴隱私資料的機器學習任務設計了一個權衡隱私傳輸與模型效果的系統。

論文列表：

MLPerf Training Benchmark
WILLUMP: A Statistically-Aware End-To-End Optimizer ForMachine Learning Inference
Privacy-Preserving Bandits

MLPerf Training Benchmark

論文連結：https://arxiv.org/pdf/1910.01500.pdf

Github 連結：https://github.com/mlperf/training

引言

日趨複雜的機器學習演算法和龐大的資料量對真正執行模型的系統提出了一系列的挑戰，在這篇文章的工作之前，業界尚未存在一套針對機器學習系統具備工業級別的衡量標準。然而，縱觀各個領域的發展，這樣的一套標準不僅能起到具有說服力的比較效果，更能促進創新，推動科研和工業界的發展。由此，來自谷歌，百度，史丹佛大學，哈佛大學等眾多業界和學界的研究人員共同合作，克服了在衡量機器學習系統的各種獨特難題，定義了一套衡量基準 MLPerf。

該論文總結分析了衡量訓練機器學習的系統的各種挑戰，針對各種機器學習任務（如：影像分類，目標檢測，機器翻譯，強化學習等）給出不同的衡量標準，並附有詳細的使用指南。

設計難點

一個訓練機器學習的系統的工作流程抽象而言就是：系統輸入端接受選定的資料集，優化器，模型，然後在系統上執行該模型直到模型質量（比如：圖片分類的精確度）達到預期水平。選擇一個系統，便要在訓練後的模型質量和系統各方面的表現之間做出權衡。

那麼，衡量訓練機器學習的系統相較於一般的計算機系統，有哪些獨特的挑戰呢？

系統優化對系統表現與模型質量的不同影響。系統層面的優化可能在短期提高系統的表現效能，卻會最終傷害到訓練的模型的質量。這就要求，系統必須執行完整個訓練過程才能判斷模型是否達標，而不能只根據短時間的吞吐量進行優劣評估。
並行化訓練規模的雙重影響。在大型分散式計算場景中，為了增加資料並行度和系統利用率，常常使用大的批量規模（batchsize）。這反過來要求調整模型的優化引數來保證模型效能，比如學習率（learning rate）。而這些引數的調整卻可能對模型訓練時間帶來負面影響。簡言之就是，大批量規模減少了每次訓練的時間，卻增加了所需的訓練次數。
模型中的隨機性引起的系統表現的差異。即使是相同的模型和超引數，在不同的訓練會話（session）中也可能需要不同的迭代次數以達到相同的準確度。這些差異為可信地比較系統表現帶來了挑戰。
不同的軟體環境的影響。不同軟體框架，不同的數學計算表達，程式設計介面等諸多因素都可能影響一個系統的表現。

MLSys提前看：機器學習的分散式優化方法
2020-02-21
機器學習分散式優化
MLSys提前看：機器學習的分散式最佳化方法
2020-02-21
機器學習分散式
學習Source Generators之瞭解Source Generators的應用場景
2024-04-12
RecSys提前看 | 深度學習在推薦系統中的最新應用
2019-09-12
深度學習
教學直播系統的應用場景和變現模式詳解
2020-03-30
模式
AAAI 2019 提前看：機器人和認知學習
2019-01-30
AI機器人
機器學習在客戶管理場景中的應用
2018-10-22
機器學習
Nginx作為web伺服器應用場景有哪些？linux系統學習體系
2021-03-25
NginxWeb伺服器Linux
快速瞭解財務RPA機器人在金融銀行業中的應用場景
2020-12-03
機器人行業
從應用場景看棧
2019-03-29
深入瞭解機器學習
2018-09-04
機器學習
機器學習 | 詳解GBDT在分類場景中的應用原理與公式推導
2020-08-17
機器學習公式
【機器學習】--LDA初始和應用
2018-04-04
機器學習LDA
渝中區：找準場景應用，區塊鏈技術加速落地
2023-03-31
區塊鏈
機器學習筆記——特徵標準化
2018-10-24
機器學習筆記特徵
3D點雲資料的標註方法和應用場景 | 景聯文科技
2023-01-06
3D
嵌入式系統要如何學習？帶你瞭解嵌入式系統學習方法
2021-04-17
資料應用場景之標籤管理體系
2020-12-30
一、你瞭解機器學習技術體系嗎
2020-08-17
機器學習
各種機器學習演算法的應用場景分別是什麼？
2018-11-23
機器學習演算法
【人工智慧】各種機器學習的應用場景分別是什麼？
2018-04-18
人工智慧機器學習
OpML 2019提前看：模型表現預測與分散式機器學習
2019-05-20
模型分散式機器學習
瞭解 Web 標準規範和組織
2019-04-20
Web
fork函式的學習--深入瞭解計算機系統
2020-12-27
函式計算機
AAAI 2020 提前看 | 三篇論文解讀問答系統最新研究進展
2020-01-31
AI
如何瞭解常見的三種物理伺服器？具體場景幫助應用
2020-09-17
伺服器
Linux系統各個版本具體應用場景!
2020-05-18
Linux
6分鐘瞭解所有機器學習模型
2020-09-23
機器學習模型
深入瞭解Azure 機器學習的工作原理
2022-03-17
機器學習
深度學習：智慧對話機器人適用場景與技術解析
2019-02-21
深度學習機器人
FIBOS DAPP 應用場景詳解
2019-02-16
APP
揭秘政企安全加速解決方案的架構與應用場景實踐
2020-05-20
架構
系統學習機器學習之半引數方法（二）--基於密度
2018-12-08
機器學習
從零開始學機器學習——瞭解迴歸
2024-09-25
機器學習
多模態學習，帶來AI全新應用場景？
2020-07-07
AI
智慧安防的主要應用場景和資料採集標註解決方案 | 景聯文科技
2023-01-06
工業智慧閘道器的功能和應用場景
2024-03-06
Linux系統各個版本具體應用場景合集！
2021-12-01
Linux

MLSys 2020提前看：多面瞭解機器學習系統標準、加速方法和應用場景

相關文章