在商業世界中，機器學習(ML)應用程式的持續宣傳和炒作有其合理的原因。機器學習(ML)可能是當今最為普及的人工智慧(AI)領域。雖然人工智慧和機器學習緊密相關，但並不是可以互換的術語。機器學習已經融入到許多業務應用程式以及面向客戶的服務中，並且可以自我學習的機器聽起來很酷。

企業在機器學習應用中需要吸取的經驗和教訓

但是，正如許多IT主管說的那樣，採用新技術可能會導致一些不切實際的期望。為此，一些機器學習和資料科學專家分享了企業和團隊在採用機器學習技術時需要吸取的經驗和教訓。

1. 沒有建立合適的團隊

企業可能擁有足夠的資料量和計算能力，但是如果團隊中沒有適合的人才，也會對業務發展造成影響。

Very公司資料科學業務負責人Jenn Gamble博士說：“我經常強調的一件事是，企業需要建立密切合作的跨學科團隊來構建機器學習產品。而資料科學家很少自己做到這一點。”

機器學習(ML)的成功應用需要具備更多的能力和技能，Gamble指出以下是關鍵的技能：

Gamble說：“沒有人在這些領域中擁有所有技能，因此有必要將擁有不同技能的人集中在一起，並鼓勵他們在整個過程中緊密合作。”

2. 沒有在業務期望和技術現實之間架起橋樑

Gamble還建議負責實施機器學習(ML)計劃的團隊還要納入與行業專家和終端使用者緊密合作的工作人員，這些人並不一定是技術人員。

Gamble說，“重要的是要有人擔任人工智慧產品經理，與傳統的產品經理一樣，他們的工作將集中在如何使用最終機器學習技術上：終端使用者是誰，他們的工作流程是什麼，以及他們將根據所提供的資訊做出什麼決定。”

大多數IT專業人員都可以理解這個問題，無論他們擁有什麼特殊的技能：在業務上期望機器學習(ML)能做什麼和實現之間可能會有一些差距(或者是巨大的差距)。

Gamble說：“從機器學習建模的角度來看，將業務理解、資料理解、可能實現的功能結合在一起也增加了複雜性。正如許多優秀的產品經理都是軟體工程師一樣，我認為很多優秀的人工智慧產品經理也是資料科學家，儘管這是一個新興領域，走上這條路的人並不多，但我們將看到，對這一角色的需求將會繼續增長。”

3. 對真相有太多的版本

機器學習的一個基本現實：模型或演算法只取決於所提供的資料。

Indico公司執行長Tom Wilde說，“對於人工智慧和機器學習來說，人們最好把它想像成一隻非常聰明的鸚鵡，它對於為學習預期任務而提供的培訓輸入資料非常敏感。”

但這導致了不同的學習方式：人們(甚至是同一團隊中的成員)如何感知特定業務流程或服務的現實可能存在很大的差異。

Indico公司使客戶可以讓多個人參與為模型建模而對培訓資料進行標記的過程。他認為這就像投票一樣：每個利益相關者在流程或任務中都有發言權。最近，該公司的一家客戶有六個人參加了資料標記過程，雖然在短期內最終失敗，但獲得了長期利益。

Wilde說：“一旦建立了模型，他們發現模型的效能非常差，經過進一步調查，他們發現這六個人對如何標記訓練樣本有完全不同的看法。這反過來迫使他們就特定任務進行了非常有價值的對話，並使他們能夠更好地對特定用例的‘基本事實'有著深入的理解。”

4. 認為訓練資料才是終點

在生產過程中，企業可能會發現對最初的訓練資料有點過於自信，並最終還是回到了起點。SigOpt公司工程主管Jim Blomo認為，即使是很好的訓練資料也不一定更好執行。

Blomo說：“不能只是訓練模型並相信它會執行。需要執行一個高度迭代的、科學的過程來使其正確執行，即使到那時，也可能仍會看到生產的高度可變性。模擬和驗證過程以及持續的效能評估也是如此。”

企業通常會發現，用於預測生產模型效能的基準實際上需要在模型開發過程中進行更改和調整。建模者首先了解到的一點是，定義正確的度量標準是最重要的任務之一，並且在通常情況下，跟蹤多個度量標準對於理解更完整的模型行為至關重要。

5. 重複傳統的軟體開發錯誤

機器學習也容易遇到困擾其他IT部門的同樣問題。企業是否在無法協同工作的功能孤島中建立了人工智慧/機器學習團隊?這將產生許多與傳統軟體專案相同的問題：考慮範圍的擴大、期限的延長、工具的損壞，以及對企業文化的不利影響。

Algorithmia公司創始人Kenny Daniel說：“很多企業花費數年時間收集大量資料，僱傭了資料科學家團隊，儘管投入大量人力和物力，卻未能使任何模型投入生產。其錯誤的做法是讓資料科學家讓實施團隊編寫程式程式碼，期望資料科學家成為DevOps專家也是錯誤的。”

那麼正確的做法是什麼?採用與現代化和最佳化用於機器學習的軟體管道相同的思維方式(例如DevOps思維方式)。

Daniel說，“建議企業學習傳統軟體世界中的DevOps經驗和教訓：建立自動化的、可重複的管道和工具，將底層的實現細節實現容器化和抽象化。”

Gamble說：“企業在構建機器學習產品時，仍然需要從軟體開發中汲取的所有相同的原則和經驗教訓，例如DevOps原則、以使用者為中心的設計等。許多資料科學家花費很多時間來學習機器學習，但是他們可能並不像軟體工程師、產品經理或設計師那樣精通這些主題。”

正如DevOps可以被看作是對傳統軟體開發面臨問題的一種廣泛響應，在機器學習和人工智慧的其他方面已經出現了新方法。

Gamble說：“由於將機器學習納入傳統產品開發組合時還需要考慮其他因素，一些新領域如MLops、DataOps、DataViz和MLUX(機器學習使用者體驗)正在蓬勃發展，試圖填補這一空白。”

企業在機器學習應用中需要吸取的經驗和教訓

相關文章