什麼是全棧資料科學家?

banq發表於2022-09-19

在 Shopify,我們接受了全棧資料科學的理念,並且經常被問到“成為全棧資料科學家意味著什麼?”。該術語最近在資料行業中出現了激增,但似乎沒有就定義達成共識。因此,我們與幾位 Shopify 資料科學家聊天,分享我們的定義和經驗。

什麼是全棧資料科學家?
通常,資料科學團隊的組織方式是讓不同的資料科學家在資料科學專案的單一方面開展工作。但是,全棧資料科學家的範圍涵蓋了端到端的資料科學專案,包括:

  • 發現和分析:您如何收集、研究和解釋來自多個不同來源的資料。此階段包括識別業務問題。

  • 採集:將來自不同來源的資料移動到您的資料倉儲中。

  • 資料建模:使用批處理、流式傳輸和機器學習工具轉換資料的過程。


哪些技能可以造就成功的全棧資料科學家? 
全棧資料科學家是通才與專家。由於全棧資料科學家擁有端到端的專案,他們與多個利益相關者和團隊合作,開發了廣泛的技術和業務技能,包括:

  • 商業頭腦:全棧資料科學家需要能夠識別業務問題,然後提出正確的問題以構建正確的解決方案。

  • 溝通:良好的溝通——或資料講故事——對於通常有助於影響決策的全棧資料科學家來說是一項至關重要的技能。您需要能夠以您的利益相關者能夠理解和實施的方式有效地傳達您的發現。 

  • 程式設計:使用 Python 和 SQL 等語言的高效程式設計技能對於將程式碼投入生產至關重要。

  • 資料分析和探索: 探索性資料分析技能是每個全棧資料科學家的關鍵工具,其結果有助於回答重要的業務問題。

  • 資料工程:全棧資料科學家應該具備構建模型管道並將其部署到生產環境的工程技能。  

  • 機器學習: 機器學習是全棧資料科學家可以用來回答業務問題或解決問題的眾多工具之一,儘管它不應該是預設設定。在 Shopify,我們支援從簡單開始,然後以複雜的方式迭代。  


成為全棧資料科學家有什麼好處?
作為一個多面手,一個全棧資料科學家是不是“無所不能”?雖然預計全棧資料科學家將在資料科學專業領域擁有廣泛的經驗,但每位資料科學家還將在特定領域帶來額外的專業知識。在 Shopify,我們鼓勵 T 型開發。強調這種型別的開發不僅使我們的資料科學家能夠磨練他們擅長的技能,而且還使我們能夠作為一個團隊廣泛工作,利用個人的深度來解決需要多種技能組合的複雜挑戰。 


總而言之,全棧資料科學家是這樣的資料科學家:

  • 專注於解決業務問題
  • 是投資於端到端解決方案的所有者,從識別業務問題到將解決方案交付到生產階段
  • 培養涵蓋所有資料科學的廣泛技能,同時培養 T 型技能
  • 知道使用哪種工具和技術,以及何時使用


 

相關文章