資料科學家會被機器學習工程師取代嗎? - KDnuggets

banq 發表於 2022-02-17
Machine Learning

在大多數資料驅動的組織中,只需要基本的資料科學技能即可解決問題。這個角色可以很容易地被機器學習工程師取代——一個具有資料科學演算法基本知識的人,他還擁有部署 ML 模型的知識。

資料科學家的角色將被 AutoML 等工具取代,而另一些人則將資料科學稱為“垂死的領域”,很快就會被資料工程和 ML 運維等角色超越。

 

大多陣列織中的資料科學工作流程非常相似。許多公司聘請資料科學家來解決類似的業務問題。大多數構建的模型不需要您提出新穎的解決方案。

您將在這些組織中解決資料驅動問題的大多數方法很可能以前已經使用過,您可以從線上可用資源的海洋中汲取靈感。

此外,AutoML 和 DataRobot 等自動化工具的興起使預測建模變得更加容易。

我將 DataRobot 用於一些業務用例,它是一個很棒的工具。它迭代許多值併為您的模型選擇最佳引數,以確保您最終獲得最高精度的模型。

因此,如果預測建模隨著時間的推移變得更加容易,為什麼公司仍然需要資料科學家?他們為什麼不直接使用自動化工具和 ML 工程師的組合來管理他們的整個資料科學工作流程?

答案很簡單:

  • 首先,資料科學從來都不是重新發明輪子或構建高度複雜的演算法。 資料科學家的角色是為擁有資料的組織增加價值。在大多數公司中,其中只有很小一部分涉及構建 ML 演算法。
  • 其次,總會有自動化工具無法解決的問題。這些工具有一組固定的演算法可供您選擇,如果您確實發現需要結合多種方法來解決的問題,您將需要手動完成。 

    儘管這種情況並不經常發生,但它仍然會發生——作為一個組織,你需要僱傭足夠熟練的人來做到這一點。此外,像 DataRobot 這樣的工具無法進行資料預處理或模型構建之前的任何繁重工作。 

資料科學家為組織提供的價值在於他們將資料應用於實際用例的能力。無論是構建細分模型、推薦系統還是評估客戶潛力,除非結果是可解釋的,否則對組織沒有真正的好處。 

只要資料科學家能夠在資料的幫助下解決問題並彌合技術和業務技能之間的差距,這個角色就會繼續存在。