規則引擎與ML模型的比較 - xLaszlo

banq發表於2022-02-21

“基於規則的系統”通常是作為ML專案的良好起點。

  

資料科學的重點是提出問題

資料科學家的工作是通過統計工具回答問題。有時一些答案可以模型的形式表現出來,但這不是必需的。

資料科學家首先關注的是問題而不是答案。這要求他們構建一個框架(使用程式碼和資料),以便驗證後續答案。

 

 

構建一個基於規則的系統很簡單?

建立規則聽起來很簡單,不是嗎?

  1. 先從 "價格>1000美元,則為真,否則為假 "這樣的內容開始;
  2. 然後你新增邏輯運算子,如AND、OR和NOT;
  3. 然後,你調整常數,進行演示;
  4. 然後你新增迴圈和分支來簡化邏輯表示式。

這就是基於規則的系統嗎?好像很簡單,但發展到最後,你可能希望將該專案委託給軟體工程團隊;他們更擅長編寫程式碼,然後資料科學家通過DSL輸入業務規則。

後來,你會發現規則引擎+DSL並不能滿足你....

  

建立人工智慧模型很難嗎?

假設您準備並構建了一個可以驗證模型的框架:

從零開始實施新的機器學習模型確實很難。但最近該領域最大的進步是:已經存在大量易於使用的高質量模型。

您可以從 spacy、huggingface 或 imagenet 等預訓練的模型開始解決標準任務。

您擁有結構化資料的 *BOOST 模型,使用 sklearn 的 LogReg 構建基線模型則沒有任何問題。

在像機器學習這樣快速發展的領域中,您不僅需要更新自己的技能,還需要更新您對所接受的合理首次嘗試的信念。

 

相關文章