Anovos解決了機器學習中資料的漂移和穩定性 – thenewstack
mobilewalla已經發布了一個新的Opensource專案:Anovos,它可以用來建立功能設計一個高效的資料管道,從攝入到功能建立和儲存。
在Mobilewalla,我們有一個專門的資料科學家團隊,負責處理世界上最大的資料集之一。我們還與全球一些使用我們解決方案的最先進的資料科學團隊合作。我們親眼目睹了漂移和穩定性帶來的模型挑戰,並構建了我們自己的解決方案來解決這些挑戰。
Anovos是我們構建的一個開源專案,透過引入資料穩定性的概念作為優先事項,解決了預測建模工作流特徵工程元件中的一些核心低效率問題。它專為擴充套件而構建,使使用者能夠使用 TB 級資料(而不是 GB 級資料)進行功能設計,並以資料漂移和穩定性為核心構建。
機器學習從業者越來越傾向於操作效能良好、可預測的生產模型,而不是那些在測試時表現出高效能但在部署時不能完全兌現承諾的模型。
在生產模型的行為與訓練和測試時不同的許多原因中,最重要和最常觀察到的原因之一是錨定它們的資料屬性的變化。用於建立用於訓練模型的特徵的原始資料與在部署中為模型提供動力的資料不同——這種現象稱為資料漂移。當真實世界的環境以意外和計劃外的方式貢獻資料時,就會發生資料漂移,這可以說是非彈性模型的主要原因。
相關文章
- 解析機器學習中的資料漂移問題機器學習
- 案例版名詞解釋:機器學習中的概念漂移!機器學習
- 機器學習演算法迴避了科學方法 - thenewstack機器學習演算法
- 機器學習中資料清洗的藝術機器學習
- 一個真實資料集的完整機器學習解決方案(上)機器學習
- 一個真實資料集的完整機器學習解決方案(下)機器學習
- 機器學習中的有標註資料集和無標註資料集機器學習
- 機器學習:探索資料和資料預處理機器學習
- 「雜談」GitHub上最全的機器學習和深度學習資料Github機器學習深度學習
- 京東白條資料架構進化之路:要在資料的不確定性中探索架構的穩定性架構
- 【小知識分享】伺服器穩定性的決定因素伺服器
- 具身智慧和機器人學習資料機器人
- 概念解讀穩定性保障
- 小資料在機器學習中的重要性機器學習
- 資料科學和機器學習面試問題資料科學機器學習面試
- 機器學習-資料清洗機器學習
- 機器學習 大資料機器學習大資料
- SAP QM 穩定性研究功能研習系列1 - 穩定性研究總流程
- 終於有人把機器學習中的文字摘要解釋清楚了!機器學習
- 【機器學習】--決策樹和隨機森林機器學習隨機森林
- 機器學習和深度學習資源蒐集機器學習深度學習
- 提高GUI自動化測試穩定性解決方案GUI
- ShifuML/shifu: Hadoop上的機器學習和資料探勘框架Hadoop機器學習框架
- Kafka 的穩定性Kafka
- 穩定性
- 定量資料和定性資料
- 機器學習中的元學習機器學習
- 機器學習中資料缺失的處理及建模方法機器學習
- 五個給機器學習和資料科學入門者的學習建議機器學習資料科學
- 機器學習-- 資料轉換機器學習
- 機器學習之清理資料機器學習
- 機器學習工程師會喜歡的5個Kubeflow 1.3新功能 - thenewstack機器學習工程師
- 薩摩耶雲建立資料安全應急處置機制可靠性和穩定性
- 圖解機器學習 | 決策樹模型詳解圖解機器學習模型
- 機器學習中的世代、迭代和批大小機器學習
- 談談人工智慧和機器學習的資料架構人工智慧機器學習架構
- 使用 .NET 5 體驗大資料和機器學習大資料機器學習
- 做資料分析需要學習機器學習嗎?機器學習