六條規則讓你更快部署機器學習模型!

人工智慧頻道發表於2018-11-20

資料科學和機器學習幾乎可以改善組織的任何方面的業務,但其前提是企業的想法得到了實施。在過去的一年裡,我們學到了很多關於更快地構建和部署機器學習模型的知識,我們希望分享一些我們在這裡學到的東西。

六條規則讓你更快部署機器學習模型!

獵豹在棕色的田野上奔跑

情況介紹

在我們的組織中,我們需要儘快為我們的分析投資產生回報。我們需要更快地將機器學習模型部署到生產中。最重要的是,我們不希望很好的想法卻束之高閣。

傳統上,我們將每個資料產品構建為定製解決方案。每個自定義解決方案之間幾乎沒有重複應用。我們需要的是資料產品的裝配線。

因此,我們構建了一條用於構建、測試和部署資料產品的裝配線,我們將之為機器學習平臺。有了它,我們現在可以在幾分鐘內將模型部署到生產中。我們不再需要等待很長時間才能獲得分析投資的回報。

我們在此過程中學到了什麼

在此過程中,我們學習了一些有關如何安全快速地構建、測試和部署機器學習模型的重要規則。這些規則改變了我們的工作方式,希望發現它們對你和你的組織有用。

(1)採用自助服務

在我們的機器學習平臺存在之前,資料科學家將建立的模型交給IT團隊,以便他們可以為每個模型建立資料管道和模型部署環境。有些模型在部署之前甚至被改寫為不同的語言。

我們構建了機器學習平臺,為模型構建者提供了通過內部模型治理流程自行部署模型的能力。自助服務是加快發展的關鍵。

(2)使用容器來提供基礎設施的抽象

容器提供了隔離和版本模型的好方法。如果你的組織使用標準伺服器負載,可能會發現很難在該標準伺服器上安裝依賴項和工件,容器解決了這個問題。你可能發現由伺服器管理人員安裝軟體包需要太長時間,容器也解決了這個問題。你可能需要在一段時間內託管同一模型的新版本和舊版本,每個版本都需要一組不同的依賴項,容器也有助於版本控制策略。

(3)資料科學家需要關心程式碼質量

為資料科學家提供自助服務部署模型到生產的能力,同時還有編寫產品質量程式碼的責任。這可能意味著你的模型構建團隊必須完成他們的軟體工程遊戲。而瞭解一點Python語法並呼叫API,並不能使你成為一名優秀的軟體工程師。當你構建組織將在生產系統中使用的軟體時,軟體質量與資料和模型質量一樣重要。

這可能意味著採用測試驅動開發和程式碼審查等實踐,這意味著嘗試配對程式設計。在你使用它時,應該仔細考慮使用膝上型電腦的方式和時間以及對軟體質量的影響。幸運的是,這些模式在軟體工程領域是眾所周知的,並且對於大多數群體來說都是可以採用的。

(4)如果沒有自動化,則不會完成。

平臺速度和穩定性都取決於模型部署平臺和流程的自動化。如果你想加快速度,那麼在採用自動化方面要毫不妥協。

在我們的機器學習平臺上,我們實現了整個模型生命週期的自動化。持續整合和持續交付驅動模型測試和平臺上的模型部署。

我們還實現了底層平臺基礎設施的配置和部署的自動化。通過這樣做,我們的團隊學會了將這些自動化虛擬機器視為可支配資源。不需要人員登入到伺服器進行管理,所有管理任務都是自動化的。這意味著無論擴充套件多少,每個伺服器都會得到一致的配置。我們不是升級伺服器,而是自動使用新的基礎設施重新部署平臺。

(5)構建支援整個模型生命週期的平臺

到目前為止,我們專注於構建、培訓和部署,但這只是機器學習模型生命週期的第一部分。許多模型經歷漂移,並隨著時間推移效能下降。而部署的模型需要進行監控和重新安裝,每個部署的模型都應記錄所有輸入、輸出和異常。模型部署平臺需要提供日誌儲存和模型效能視覺化。

在我們的機器學習平臺上,每個模型都將每個執行記錄為通用格式。每個託管模型應用程式都以通用方式發出日誌。我們路由和儲存這些日誌,使用它們來監控模型效能,並幫助識別漂移。最後,我們會自動建立模型儀表板,以提供有關每個模型執行情況的其他見解。

密切關注模型效能是有效管理機器學習模型生命週期的關鍵。你不能忽視模型監控作為模型整個生命週期的一部分。

(6)標準化的共同開發方法

軟體工程師提出了可用於構建行動式和彈性應用程式的出色方法和設計模式。如果你的模型構建者瞭解這些方法,那麼很多方法都可以輕鬆地適應機器學習應用程式。 

六條規則讓你更快部署機器學習模型!

機器學習平臺的非正式格言

獲得的結果

結合這六條規則有助於我們獲得更快的結果,我希望它們也能為你的組織提供幫助。資料科學應該是關於建立具有影響力的軟體。如果有的話,白皮書、儀表板、文字雲和餅圖就不會再削減它,而獲得成果需要付出更多的努力。

這不是一條容易的道路。蘋果公司創始人史蒂夫•賈伯斯說:"在優秀的創意與產品之間隔著巨大的鴻溝。"為了快速進入市場,可能需要採用DevOps。這意味著你的團隊可能需要升級其軟體工程技能組合。

但是這是值得的。過去有時需要12個月的時間的工作現在需要幾分鐘才能完成。更重要的是,我們不是在構建分析貨架。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545819/viewspace-2220769/,如需轉載,請註明出處,否則將追究法律責任。

相關文章