19、如何使用機器學習結果

weixin_34148340發表於2019-02-23

一旦找到調整了問題的可行模型,就可以使用該模型了。您可能需要重新審視自己的原因並提醒自己,您需要針對所解決問題的解決方案。

在對結果執行某些操作之前,不會解決此問題。在這篇文章中,您將學習在將原型模型轉換為生產系統時回答問題和考慮因素的結果。

結果介紹
照片歸屬於Phil Sexton,保留了一些權利

根據您要解決的問題型別,結果的呈現方式會有很大差異。利用機器學習成果的結果有兩個主要方面:

  • 報告結果
  • 作業系統

報告結果

一旦你發現了一個好的模型和一個足夠好的結果(或者不是,視情況而定),你將需要總結所學的內容並將其呈現給利益相關者。這可能是您自己,客戶或您工作的公司。

使用powerpoint模板並解決下面列出的部分。您可能希望編寫一個分頁器並將部分部分用作部分標題。即使在您為自己做的小型實驗專案(例如教程和比賽)上也要嘗試遵循此過程。很容易在專案上花費過多的時間,並且您希望確保捕獲您沿途學到的所有偉大的事物。

以下是報告專案結果時可以完成的部分。

  • 上下文(為什麼):定義中的存在問題,並建立了動力環境研究問題。
  • 問題(問題):簡要地將問題描述為您出去並回答的問題。
  • 解決方案(答案):簡要描述解決方案,作為您在上一節中提出的問題的答案。請明確點。
  • 調查結果:您在觀眾感興趣的路上發現的專案符號列表。它們可能是資料中的發現,已完成或未起作用的方法,或者您在旅程中獲得的模型效能優勢。
  • 限制:考慮模型不起作用的地方或模型未回答的問題。不要回避這些問題,如果你可以定義它不擅長的地方,那麼定義模型擅長的地方會更加可信。
  • 結論(為什麼+問題+答案):重新審視為什麼,研究問題和你在一個簡單的小包裝中發現的答案,這些包裝易於記憶併為自己和他人重複。

您要呈現的受眾型別將定義您要詳細說明的詳細資訊量。通過結果報告來完成專案的紀律,即使是小型專案,也會加速您在現場的學習。在這些小型專案中,我強烈建議在部落格或社群上分享輔助專案的結果,並獲得您可以捕獲的反饋,並將其帶入您下一個專案的開始。

操作化

您已經找到了一個足以解決您希望將其投入生產的問題的模型。對於有趣的專案,這可能是您工作站上的操作安裝,一直到將模型整合到現有企業應用程式中。範圍很廣。在本節中,您將學習操作模型的三個關鍵方面,您可以在將系統投入生產之前仔細考慮。

您應該仔細考慮的三個方面是演算法實現,模型的自動測試以及隨時間跟蹤模型的效能。這三個問題很可能會影響您選擇的模型型別。

演算法實現

您可能正在使用研究庫來發現表現最佳的方法。研究庫中的演算法實現可以很好,但它們也可以針對問題的一般情況而不是您正在使用的特定情況編寫。

通過將這樣的實現直接投入生產,可以非常認真地考慮您可能建立的依賴關係和技術債務。請考慮查詢支援您要使用的方法的生產級庫。如果此時切換到生產級別庫,則可能必須重複演算法調整過程。

您也可以考慮自己實施演算法。此選項可能會引入風險,具體取決於您選擇的演算法的複雜程度以及它使用的實現技巧。即使使用開原始碼,也可能存在許多複雜的操作,這些操作可能很難內化並且可靠地重現。

模型測試

編寫自動化測試,驗證可以構建模型並重復實現最低階別的效能。還要為任何資料準備步驟編寫測試。您可能希望控制每個單元測試執行的演算法使用的隨機性(隨機數種子),以便測試100%可重複。

跟蹤

新增基礎設施以監控模型的效能,並在精度降至最低水平以下時發出警報。跟蹤可以在單獨的環境中實時發生,也可以在重新建立的模型上使用實時資料樣本。引發警報可以指示資料中的模型所學習的結構已經改變(概念漂移)並且可能需要更新或調整模型。

有些模型型別可以執行線上學習並自行更新。仔細考慮允許模型在生產環境中自我更新。在某些情況下,管理模型更新過程並切換模型(其內部配置)可能更明智,因為它們經過驗證更具效能。

摘要

在這篇文章中,您瞭解到在交付結果之前,專案不會被視為完成。結果可能會呈現給您自己或您的客戶,並且在呈現結果時需要遵循最低結構。

在生產環境中使用學習模型時,您還學習了三個問題,特別是演算法實現的性質,模型測試和正在進行的跟蹤。

相關文章