Anovos解決了機器學習中資料的漂移和穩定性 – thenewstack
mobilewalla已經發布了一個新的Opensource專案:Anovos,它可以用來建立功能設計一個高效的資料管道,從攝入到功能建立和儲存。
在Mobilewalla,我們有一個專門的資料科學家團隊,負責處理世界上最大的資料集之一。我們還與全球一些使用我們解決方案的最先進的資料科學團隊合作。我們親眼目睹了漂移和穩定性帶來的模型挑戰,並構建了我們自己的解決方案來解決這些挑戰。
Anovos是我們構建的一個開源專案,透過引入資料穩定性的概念作為優先事項,解決了預測建模工作流特徵工程元件中的一些核心低效率問題。它專為擴充套件而構建,使使用者能夠使用 TB 級資料(而不是 GB 級資料)進行功能設計,並以資料漂移和穩定性為核心構建。
機器學習從業者越來越傾向於操作效能良好、可預測的生產模型,而不是那些在測試時表現出高效能但在部署時不能完全兌現承諾的模型。
在生產模型的行為與訓練和測試時不同的許多原因中,最重要和最常觀察到的原因之一是錨定它們的資料屬性的變化。用於建立用於訓練模型的特徵的原始資料與在部署中為模型提供動力的資料不同——這種現象稱為資料漂移。當真實世界的環境以意外和計劃外的方式貢獻資料時,就會發生資料漂移,這可以說是非彈性模型的主要原因。
相關文章
- 解析機器學習中的資料漂移問題機器學習
- Kafka 的穩定性Kafka
- 機器學習中資料清洗的藝術機器學習
- 提高GUI自動化測試穩定性解決方案GUI
- 排序穩定性排序
- 案例版名詞解釋:機器學習中的概念漂移!機器學習
- 【穩定性】穩定性建設之依賴設計
- 淺談系統的不確定性與穩定性
- 如何保持Oracle資料庫SQL效能的穩定性Oracle資料庫SQL
- 機器學習中資料缺失的處理及建模方法機器學習
- 【穩定性】從專案風險管理角度探討系統穩定性
- App穩定性測試APP
- 【小知識分享】伺服器穩定性的決定因素伺服器
- SAP QM 穩定性研究功能研習系列1 - 穩定性研究總流程
- 怎樣保持Oracle資料庫SQL效能的穩定性Oracle資料庫SQL
- 備份後,對資料庫的穩定性檢查資料庫
- 萬字長文深度解讀亞信安慧AntDB-T資料庫鎖——效能和穩定性的保障資料庫
- ORALCE的執行計劃穩定性
- 穩定性五件套-限流的原理和實現
- kafka-穩定性-事務Kafka
- Apache Flink 在小米的穩定性最佳化和實踐Apache
- 如何維持網站穩定性的方式?網站
- FastHook——遠超YAHFA的優異穩定性ASTHook
- ORALCE的執行計劃穩定性(zt)
- 京東白條資料架構進化之路:要在資料的不確定性中探索架構的穩定性架構
- 丟失Oracle中資料檔案Ora時的解決辦法Oracle
- TPP穩定性之場景隔離和多租戶
- Node.js 指南(ABI穩定性)Node.js
- app穩定性測試-iOS篇APPiOS
- 研發效能與穩定性保障
- Linux中資料夾的解讀Linux
- 這是阿里技術專家對 SRE 和穩定性保障的理解阿里
- 安全沙箱技術的原理、應用程式的安全性和穩定性
- 伺服器的穩定性怎麼檢測?伺服器
- 軟體穩定性測試的測試點
- 定量資料和定性資料
- Oracle中資料塊中row number缺失(記錄,未解決)Oracle
- 影響資料庫效能與穩定性的幾個重要引數資料庫