成熟機器學習系統持續改進面臨的問題 - danshiebler

banq發表於2021-11-10

任何在大公司建立機器學習模型的人都會認識到。對成熟的機器學習系統進行可衡量的改進是極其困難的：
機器學習系統極其複雜，並且具有破壞軟體元件之間抽象的令人沮喪的能力。這對 ML 成功必不可少的迭代開發型別提出了廣泛的挑戰。

大多數軟體系統會仔細控制哪些層需要相互通訊以及需要沿每個層邊界公開哪些資料。對於一個新的機器學習系統來說，需要打破現有的抽象並連線被設計為獨立的層是很常見的。
例如：

新的特徵標準化策略可能需要將原始資料暴露給旨在使用處理過的資料的系統部分。
將前饋神經網路遷移到圖神經網路可能需要在推理時訪問節點鄰居的特徵。
調整模型以使用另一個模型的預測作為特徵可能需要將模型配置為按順序執行而不是並行執行。

我們有標籤的樣本分佈與我們必須執行推理的樣本分佈相同是非常罕見的。例如：

點選率 (CTR) 預測模型不會收到使用者未看到的樣本標籤。
大多數內容稽核系統只收到關於一個很小的、通常不具有代表性的資料子集的反饋。
大多數感測器分析演算法都建立在具有不切實際的低噪聲水平的標記資料集之上。

在許多情況下，我們的模型接收到的標記資料取決於它生成的預測。這種情況的一些經典示例包括：

大多數推薦系統不會收到有關使用者未看到的任何樣本的使用者反饋。
有效檢測和懲罰使用者某些行為的系統可能會導致使用者修改他們的行為以避免懲罰。
如果內容稽核系統是根據使用者報告進行訓練的，那麼隨著使用者報告率的降低，系統覆蓋率的增加可能會導致模型訓練資料的減少。

在生產機器學習系統中，看似獨立的元件通常表現出隱藏的緊密耦合。這會使實驗具有挑戰性。更改一個系統而不更改另一個系統會導致效能下降，同時更改兩個系統通常容易出錯且需要大量協調。一些例子包括：

一旦開發了特徵管道並可供模型使用，對該管道的任何更改（甚至糾正錯誤！）都有可能損害使用該特徵的模型的效能。這迫使 ML 工程師對所有功能更改進行版本控制，從而導致功能管道極快地變成笨拙的怪物。
在大規模推薦系統中，輕型機器學習模型或基於啟發式的候選生成系統通常會選擇重型機器學習模型從中選擇的候選集。對候選生成系統的任何更改都會影響饋送到重模型的樣本分佈，這可能會影響該模型的效能。
某些模型（例如語義模型或物件檢測模型）生成其他模型用作特徵的訊號是很常見的。在這種情況下，對上游模型的任何更改或改進都可能損害消耗其預測的下游模型的效能。

機器學習應用面臨的一些問題
2020-07-27
機器學習
【機器學習】【深度學習】【人工智慧】【演算法工程師】面試問題彙總（持續更新）
2018-12-21
機器學習深度學習人工智慧演算法工程師面試
機器學習職位面臨消失
2019-03-04
機器學習
機器學習面試問題彙總
2020-04-04
機器學習面試
資料科學和機器學習面試問題
2019-02-28
資料科學機器學習面試
作業系統（考研，面試，期末複習）- 持續更新
2020-10-22
作業系統面試
機器學習6-迴歸改進
2021-01-21
機器學習
機器學習完整資源推薦（持續更新中）
2020-12-13
機器學習
【11】進大廠必須掌握的面試題-持續整合面試
2020-10-19
面試題
機器學習：迴歸問題
2020-08-09
機器學習
學習《Java虛擬機器》目錄索引(持續更新中)
2020-12-15
Java虛擬機索引
入駐線上教育saas系統會面臨哪些問題？
2020-09-24
進行有效漏洞管理需要面臨哪些問題?
2022-04-12
總結Java開發面試常問的問題，持續更新中~
2018-06-04
Java面試
【12】進大廠必須掌握的面試題-持續測試面試
2020-10-21
面試題
AI面試題（持續更新）
2020-11-09
AI面試題
Hbase面試題(持續更新)
2020-11-28
面試題
實時機器學習是什麼，面臨哪些挑戰？
2018-11-15
機器學習
通俗講明白機器學習中的學習問題 - svpino
2021-03-02
機器學習
【演算法工程師】機器學習面試問題總結
2019-03-12
演算法工程師機器學習面試
機器學習問題方法總結
2018-10-11
機器學習
機器學習之分類問題度量
2020-02-14
機器學習
企業管理系統上線後可能會面臨哪些問題？
2020-04-22
神經網路進化能否改變機器學習？
2018-04-18
神經網路機器學習
快取系統中面臨的雪崩/穿透/一致性問題
2019-02-13
快取穿透
AnimalController 學習持續更新
2024-10-27
Controller
Linux 系統化學習系列文章總目錄（持續更新中）
2018-05-10
Linux
Flutter 問題集，持續更新
2019-01-13
Flutter
面經問題學習
2020-12-14
Spring面試題（持續更新中）
2020-10-18
Spring面試題
愛玩手機的貓Linux學習筆記（持續更新）
2020-11-13
Linux筆記
靜態隨機儲存器SRAM面臨兩大問題挑戰
2020-07-28
隨機
Spring Boot初學改錯合集（持續更新）
2020-10-07
Spring Boot
在Linux中，如何進行系統效能的持續監控？
2024-06-06
Linux
10道機器學習、深度學習必會面試題
2018-05-02
機器學習深度學習面試題
整理有關面試普遍問題和回答技巧 (持續更新～)
2019-10-30
面試
機器學習中的類別不均衡問題
2018-09-26
機器學習
解析機器學習中的資料漂移問題
2023-02-06
機器學習

成熟機器學習系統持續改進面臨的問題 - danshiebler

相關文章