什麼是全棧資料科學家?
在 Shopify,我們接受了全棧資料科學的理念,並且經常被問到“成為全棧資料科學家意味著什麼?”。該術語最近在資料行業中出現了激增,但似乎沒有就定義達成共識。因此,我們與幾位 Shopify 資料科學家聊天,分享我們的定義和經驗。
什麼是全棧資料科學家?
通常,資料科學團隊的組織方式是讓不同的資料科學家在資料科學專案的單一方面開展工作。但是,全棧資料科學家的範圍涵蓋了端到端的資料科學專案,包括:
- 發現和分析:您如何收集、研究和解釋來自多個不同來源的資料。此階段包括識別業務問題。
- 採集:將來自不同來源的資料移動到您的資料倉儲中。
- 資料建模:使用批處理、流式傳輸和機器學習工具轉換資料的過程。
哪些技能可以造就成功的全棧資料科學家?
全棧資料科學家是通才與專家。由於全棧資料科學家擁有端到端的專案,他們與多個利益相關者和團隊合作,開發了廣泛的技術和業務技能,包括:
- 商業頭腦:全棧資料科學家需要能夠識別業務問題,然後提出正確的問題以構建正確的解決方案。
- 溝通:良好的溝通——或資料講故事——對於通常有助於影響決策的全棧資料科學家來說是一項至關重要的技能。您需要能夠以您的利益相關者能夠理解和實施的方式有效地傳達您的發現。
- 程式設計:使用 Python 和 SQL 等語言的高效程式設計技能對於將程式碼投入生產至關重要。
- 資料分析和探索: 探索性資料分析技能是每個全棧資料科學家的關鍵工具,其結果有助於回答重要的業務問題。
- 資料工程:全棧資料科學家應該具備構建模型管道並將其部署到生產環境的工程技能。
- 機器學習: 機器學習是全棧資料科學家可以用來回答業務問題或解決問題的眾多工具之一,儘管它不應該是預設設定。在 Shopify,我們支援從簡單開始,然後以複雜的方式迭代。
成為全棧資料科學家有什麼好處?
作為一個多面手,一個全棧資料科學家是不是“無所不能”?雖然預計全棧資料科學家將在資料科學專業領域擁有廣泛的經驗,但每位資料科學家還將在特定領域帶來額外的專業知識。在 Shopify,我們鼓勵 T 型開發。強調這種型別的開發不僅使我們的資料科學家能夠磨練他們擅長的技能,而且還使我們能夠作為一個團隊廣泛工作,利用個人的深度來解決需要多種技能組合的複雜挑戰。
總而言之,全棧資料科學家是這樣的資料科學家:
- 專注於解決業務問題
- 是投資於端到端解決方案的所有者,從識別業務問題到將解決方案交付到生產階段
- 培養涵蓋所有資料科學的廣泛技能,同時培養 T 型技能
- 知道使用哪種工具和技術,以及何時使用
相關文章
- 資料科學家最需要什麼技能?資料科學
- Python全棧指什麼?全棧工程師的意義是什麼?Python全棧工程師
- 為什麼Jupyter是資料科學家們實戰工具的首選?資料科學
- 為什麼資料科學家應該開始學習Swift?資料科學Swift
- 什麼是現代資料棧?有什麼特徵?特徵
- 【資料科學家】如何成為一名資料科學家?資料科學
- 什麼是全棧式無伺服器? - DEV全棧伺服器dev
- 你對全棧工程師的理解是什麼?全棧工程師
- 初創公司資料科學專案全流程指南,一位資深資料科學家的經驗談資料科學
- 準確度VS速度——資料科學家能從搜尋中學到什麼?資料科學
- 2018年科學家們都在搜尋什麼:AI還是癌症?AI
- 資料科學50年,資料科學家是否依然是21世紀最性感的職業?資料科學
- 如果倫敦地鐵圖是資料科學家畫的……資料科學
- 資料分析師與資料科學家有什麼不同? - Reddit資料科學
- 到底什麼是大資料?新手學大資料的路徑是什麼?大資料
- 為什麼說Typescript是必學語言以及如何學會TS全棧開發TypeScript全棧
- 這七家BAT公司,誰家資料科學家更多BAT資料科學
- 資料科學家已死?AutoML使得資料科學更加普及化 - enterpriseai資料科學TOMLAI
- 資料科學、機器學習、人工智慧的區別到底是什麼?資料科學機器學習人工智慧
- 業界 | 資料科學家“恐怖故事”資料科學
- 資料科學家的命令列技巧資料科學命令列
- 如何成為資料科學家? - kdnuggets資料科學
- 公民資料科學家的侷限性資料科學
- 幽默:各個學科專家的思維特點是什麼樣? - Deniz
- 資料科學家需要的基礎技能資料科學
- 為什麼Python是資料科學領域的首選語言?Python入門學習Python資料科學
- 資料工程師、掌握資料分析,成為資料科學家、資料庫遷移專家工程師資料科學資料庫
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- Spotify如何改進資料科學家的資料發現?資料科學
- 什麼是大資料?大資料能做什麼?大資料
- 資料分析師、資料科學家、大資料專家三個職位的區別資料科學大資料
- 什麼是大資料?大資料開發是做什麼的?大資料
- 什麼是資料運營?資料運營是做什麼的?
- 全球40億人沒有地址,於是資料科學家想到了機器學習資料科學機器學習
- python學習之什麼是組合資料?Python
- 什麼是資料流?
- 什麼是資料蔓延?
- 什麼是大資料?大資料