為什麼機器學習模型會越來越糟? - Santiago
當完成了機器學習模型的構建並且部署了。不幸的是,工作並沒有完成。可以說,您只走了一半,機器學習模型的效能會隨著時間的推移而降低。
機器學習模型的快速入門:
x->y:
- x:輸入資料
- y:輸出預測
- ->:模型在X和y之間學習的關係。
資料漂移
當我們部署模型時,如果輸入X的資料發生變化會發生什麼?這稱為“資料漂移”。當我們提供給模型的資料與我們用來訓練模型的資料不同時,就會發生這種情況。
資料漂移的一個示例:10年前構建的面部識別系統開始看到使用解析度更高的相機拍攝的照片時,雖然我們的面孔仍然相同,但是資料不同。這種逐漸的變化會扼殺系統的結果。
概念漂移
回到我們的模型x->y,如果X和y之間的關係發生變化會發生什麼?這稱為“概念漂移”。當模型學習的模式不再有效時,就會發生這種情況。
概念漂移的一個例子:當Covid將我們所有人變成沙發上的土豆時,Netflix用來預測觀眾收看電視節目的模型就變得毫無用處,資料沒有改變。模型學到的模式卻變化了。
隨著時間的推移,這也可能會緩慢發生,例如使用模型預測突然開始面臨競爭的某些產品的購買模式。或隨著時間的流逝改變其含義的詞語,或者我們對錯誤和錯誤的定義和容忍度。
出路
總之,資料和概念的漂移對我們模型的質量構成了重大威脅。
資料漂移和概念漂移可能會逐漸發生,也可能會在一夜之間發生:
- •人臉識別示例:逐漸漂移。
- •Netflix示例:突然漂移。
解決方法:
- •監控模型
- •定期更新模型
每一個機器學習模型都需要持續的監控。這是與更新模型以保持適當效能的過程一起進行的必要步驟。更新可能簡單到使用新資料重新訓練模型的新版本,也可能複雜到解決問題的全新實現。
相關文章
- 為什麼前端工作越來越難找了?前端
- 為什麼線上辦公套件越來越流行套件
- Java找工作為什麼越來越難,有什麼技巧嘛?Java
- 為什麼專案管理平臺越來越普及?專案管理
- 為什麼越來越少的人用jQueryjQuery
- 為什麼越來越多的人需要代理IP?
- 為什麼我們越來越不喜歡用網站?網站
- 為什麼前端工程越來越愛使用 Monorepo 架構?前端Mono架構
- 為什麼軟體測試行業越來越受歡迎?行業
- 為什麼雲辦公平臺被越來越廣泛的接受
- 現代前端工程為什麼越來越離不開 Monorepo?前端Mono
- 科技大爆炸:網際網路為什麼越來越黃?
- 為什麼我們的web前端變的越來越複雜Web前端
- 2019年,為什麼前端工程師薪資會越來越高?前端工程師
- 為什麼機器學習會選擇Python語言?機器學習Python
- switch健身環?為什麼越炒越“香”?
- 為什麼Web前端變的越來越複雜,變得更加難學了Web前端
- 國內二次元遊戲美術為什麼越來越“卷”了?二次元遊戲
- 為什麼越來越多的開發者選擇使用Spring Boot?Spring Boot
- 為什麼越來越多企業需要低程式碼開發
- 為什麼 Windows7 C 盤可用空間越來越小?Windows
- 為什麼現在開發一款軟體的時間越來越長?
- 為什麼短視訊拓客營銷系統越來越受歡迎呢?
- Android手機為什麼越用越卡?原來是它們搗的鬼Android
- 為什麼獨立伺服器越來越受到公司的喜歡?比共享主機有什麼優勢伺服器
- 轉享:為什麼模型會打敗指令碼?模型指令碼
- 為什麼電腦會越來越慢?電腦速度慢的原因分析及解決方法
- 越過5G的時代斷崖:搜狗分身技術會為IP產業帶來什麼?產業
- 產品經理為什麼越來越不值錢?不懂資料,只能尷尬退場
- Python的虛擬環境是什麼? - SantiagoPythonGo
- Python教程學習:為什麼越來越多的人學Python?Python
- 為什麼越來越多的人選擇RDS建立MySQL資料庫?MySql資料庫
- 為什麼越來越多的網站安裝了SSL證書?網站
- 為什麼越來越多的企業選擇遠端辦公?
- 為什麼越來越多企業開始製作智慧展廳
- 為什麼越來越少的開源專案使用 GPL 協議協議
- 前端什麼技術越來越重要 哪些前端框架有前景前端框架
- 函式式思維: 為什麼函數語言程式設計越來越受關注函式函數程式設計