為什麼機器學習模型會越來越糟? - Santiago
當完成了機器學習模型的構建並且部署了。不幸的是,工作並沒有完成。可以說,您只走了一半,機器學習模型的效能會隨著時間的推移而降低。
機器學習模型的快速入門:
x->y:
- x:輸入資料
- y:輸出預測
- ->:模型在X和y之間學習的關係。
資料漂移
當我們部署模型時,如果輸入X的資料發生變化會發生什麼?這稱為“資料漂移”。當我們提供給模型的資料與我們用來訓練模型的資料不同時,就會發生這種情況。
資料漂移的一個示例:10年前構建的面部識別系統開始看到使用解析度更高的相機拍攝的照片時,雖然我們的面孔仍然相同,但是資料不同。這種逐漸的變化會扼殺系統的結果。
概念漂移
回到我們的模型x->y,如果X和y之間的關係發生變化會發生什麼?這稱為“概念漂移”。當模型學習的模式不再有效時,就會發生這種情況。
概念漂移的一個例子:當Covid將我們所有人變成沙發上的土豆時,Netflix用來預測觀眾收看電視節目的模型就變得毫無用處,資料沒有改變。模型學到的模式卻變化了。
隨著時間的推移,這也可能會緩慢發生,例如使用模型預測突然開始面臨競爭的某些產品的購買模式。或隨著時間的流逝改變其含義的詞語,或者我們對錯誤和錯誤的定義和容忍度。
出路
總之,資料和概念的漂移對我們模型的質量構成了重大威脅。
資料漂移和概念漂移可能會逐漸發生,也可能會在一夜之間發生:
- •人臉識別示例:逐漸漂移。
- •Netflix示例:突然漂移。
解決方法:
- •監控模型
- •定期更新模型
每一個機器學習模型都需要持續的監控。這是與更新模型以保持適當效能的過程一起進行的必要步驟。更新可能簡單到使用新資料重新訓練模型的新版本,也可能複雜到解決問題的全新實現。
相關文章
- Python教程學習:為什麼越來越多的人學Python?Python
- 為什麼機器學習會選擇Python語言?機器學習Python
- 機器為什麼能夠學習?
- 為什麼前端工作越來越難找了?前端
- 為什麼女性內衣越來越貴?
- 為什麼獨立伺服器越來越受到公司的喜歡?比共享主機有什麼優勢伺服器
- Java找工作為什麼越來越難,有什麼技巧嘛?Java
- 為什麼現在越來越多的人選擇學習軟體測試?
- 為什麼機器學習會選擇Python語言?很簡單!機器學習Python
- 雙11規則為什麼越來越複雜?
- 為什麼線上辦公套件越來越流行套件
- 為什麼專案管理平臺越來越普及?專案管理
- 為何我們使用的手機會越來越貴
- (轉)為什麼選擇機器學習策略機器學習
- 2019年,為什麼前端工程師薪資會越來越高?前端工程師
- 為什麼越來越少的人用jQueryjQuery
- 為什麼前端工程越來越愛使用 Monorepo 架構?前端Mono架構
- 為什麼Web前端變的越來越複雜,變得更加難學了Web前端
- 機器學習 # 為什麼機器學習要求資料是獨立同分布的?機器學習
- 機器學習模型機器學習模型
- 為什麼越來越多的人蔘與DAO?
- 為什麼越來越多的人需要代理IP?
- 為什麼我們越來越不喜歡用網站?網站
- 現代前端工程為什麼越來越離不開 Monorepo?前端Mono
- 機器學習--要學點什麼機器學習
- 機器學習不能做什麼?機器學習
- 什麼是機器學習治理?機器學習
- 機器學習為什麼難以產品化? - kdnuggests機器學習
- 機器學習可解釋性系列 - 是什麼&為什麼&怎麼做機器學習
- 張量tensor:機器學習的基本資料結構介紹 - Santiago機器學習資料結構Go
- 為什麼雲辦公平臺被越來越廣泛的接受
- 免費視覺化工具為什麼越來越受歡迎?視覺化
- 為什麼軟體測試行業越來越受歡迎?行業
- 什麼是 AI、機器學習與深度學習?AI機器學習深度學習
- 什麼是AI、機器學習與深度學習?AI機器學習深度學習
- 為什麼 PHP 在 2024 年會越來越受歡迎:經典語言的意外迴歸PHP
- Python入門很難嗎? 為什麼越來越多的人都學Python?Python
- 漫畫:什麼是機器學習機器學習