做機器學習專案的checklist

AIBigbull2050發表於2020-01-21


2020-01-20 18:06:29

作者:datarevenue

編譯:ronghuaiyang

導讀

這個checklist能幫助你邁出做一個成功的機器學習專案第一步。

避免混淆,用這個簡單的清單來計劃你的 AI 專案。


對許多人來說,機器學習仍然是一項新技術,這可能會讓它難以管理。


專案經理通常不知道如何與資料科學家談論他們的想法。


在我們規劃 30 多個機器學習專案的經驗中,我們提煉出了一個簡單有效的checklist。


做機器學習專案的checklist



1. 專案動機

做機器學習專案的checklist


明確你的專案的更廣泛的意義。

  • 你要解決的問題是什麼?What is the problem you want to solve?
  • 相關聯的目標策略是什麼?

如果專案團隊不理解你的動機,那麼他們就很難提出好的建議。

有很多方法可以解決機器學習的問題。所以幫助你的團隊以你最感興趣的方式工作 —— 退一步告訴他們為什麼這個專案是重要的。



2. 問題定義

  • 你想要預測的具體 輸出是什麼?

對於給定的輸入,你的機器學習模型將理想地學會預測非常具體的輸出。

所以這裡你要儘可能的清楚。“預測機器故障”可能意味著很多事情 —— “告訴我,在未來 24 小時內,意外停機的風險何時增加 50%以上”更好。

  • 你的演算法有什麼 輸入資料?

模型預測輸出的唯一方法是從模型的輸入因子中派生出來。所以,為了有機會做出好的預測,你必須有與輸出相關的資料。資料越多越好。

  • 什麼是預測你的具體輸出的最 相關因素?

演算法不能理解我們的世界。重要的是,你要給資料科學家一些提示,告訴他哪些資料實際上是相關的,這樣他就可以用演算法能夠理解的方式選擇和分割資料。

  • 你能提供多少 訓練樣本 ?

一個演算法需要的練習比一個人要多得多。你 最少需要 200 個樣本。越多越好。



3. 效能度量

做機器學習專案的checklist


你怎麼知道什麼是好的結果?

  • 你有一個簡單的基準測試來比較你的結果嗎?

有沒有一種簡單的方法來利用你已有的資料進行預測?也許你可以根據去年的數字預測銷售額,或者通過計算客戶上一次登入後的天數來評估客戶離開的風險。一個簡單的基準測試可以為你的團隊提供有價值的問題洞察力。它給你一些東西來衡量模型。

  • 你將如何衡量預測的 準確性 ?
  • 你期望的最低準確度是多少?

你希望預測的準確率平均在 5% 以內,還是更重要的是預測誤差不超過 10%?你的模型可以以任何一種方式進行調優。哪種方式更好取決於什麼對你來說是重要的。

  • 一個完美的解決方案是什麼樣的?

即使這對你來說是顯而易見的,把它寫在紙上也能幫助你理清思路。

  • 是否有 參考解決方案(如研究論文)?

如果有人以前解決過類似的問題,就把他們的解決方案當作靈感。這為每個人提供了一個共同的起點,這樣他們就可以看到要使用哪些資料,可能會出現哪些問題,以及要嘗試哪些演算法。



4. 時間線

做機器學習專案的checklist


一個效能驗證專案的時間線示例。

  • 是否有 截止日期需要注意?
  • 你什麼時候需要看到第一個結果?
  • 你想什麼時候有一個完整的解決方案?

人工智慧解決方案可以無限地改進。明確的最後期限有助於讓團隊集中精力。


5. 聯絡人

  • 負責專案(PM)?
  • 誰可以授權 訪問資料集?
  • 誰能幫助 理解當前的流程和/或簡單的基準測試(領域專家)?

在一個專案的過程中會出現許多問題。明確你的工程師可以向誰求助。

6. 合作

做機器學習專案的checklist


  • 在業務和工程團隊之間建立一個雙/周的 更新

每週安排一次會議來檢視當前的結果,並討論那些不需要通過電子郵件來回答的問題。

  • 應該涉及誰 ?
  • 他們應該學什麼

在學習如何管理人工智慧方面,沒有什麼比實際專案的實踐經驗更有價值。如果你想讓你的團隊的其他成員學習,從一開始就要說清楚。

  • 定義程式碼和問題的位置以及如何訪問程式碼。

讓所有的開發從一開始就透明。這樣任何人都可以很容易地加入,給出提示,並檢查進展。



回答這個清單上的問題,並與大家分享

世界仍在研究如何最好地執行人工智慧/機器學習專案。填寫這份清單將會給你所有成功的機器學習專案的要素之一:理解。

英文原文:https://www.datarevenue.com/en-blog/machine-learning-project-checklist






https://blog.csdn.net/weixin_42137700/article/details/104058390



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2674189/,如需轉載,請註明出處,否則將追究法律責任。

相關文章