文/ 曾加 螞蟻金服資料分析師
導語:從零開始學資料分析,什麼程度可以找工作?螞蟻金服資料分析專家從三個關鍵問題出發,幫你係統梳理應該如何進入資料分析行業。
很多人建議新手去點亮很多技能樹,什麼 Excel/統計學/SQL/R/Python/Hadoop/機器學習/視覺化 等等,對此我並不是非常認同,原因很簡單:如果目的在於「找工作」,核心在於「快速入行」,而不在於「系統學習」,因此一開始學習這麼多領域的知識是不太合適的。
接下來,要「逆向思考」,分步解答這個問題。
問題一
我想進什麼樣的公司?
在我心目中,資料分析師的日常工作狀態應該是怎樣的?
這個問題非常重要,甚至比學什麼更重要,因為同樣 title 為「資料分析師」的職位,工作內容可能大相徑庭:有的類似於「商業諮詢師」,有的類似於「資料倉儲工程師」,有的類似於「機器學習工程師」,也有的類似於「資料口徑核對師」等等。
這些同樣名為「資料分析師」的崗位,不僅工作內容完全不同,需要的技能樹也完全不一樣。如果不弄清它們各自所需的技能樹,就去「盲人摸象」般地學習各類知識,到頭來找工作時看到崗位需求的時候,很可能會傻眼。
舉個例子:在一些大型的網際網路公司(如阿里、騰訊等)裡,有一個崗位叫「商業資料分析師」,聽起來挺高大上的,不過如果我告訴你,做這個崗位的很多人不需要懂統計學,不需要懂 Python,更不需要懂什麼機器學習,只需要會 SQL 並且有「業務sense」就可以了,你是不是會感到驚訝和疑惑呢?但事實就是如此。
必須要說的是,不是所有的「資料分析師」都需要用到高大上的工具,因為大部分資料分析師的核心目標是「解決問題」(而解決問題所用的方法則未必重要),而解決問題的核心往往是「懂業務」,這是很多公司在招聘時強調「業務sense」的重要原因。如果覺得會很多技能就很厲害,那是典型的「學生思維」。
P.S. 也許你又有一個疑問,對於剛入行的人來說,所謂的「業務sense」如何判斷呢?或者說,面試的時候,面試官如何判斷一個初級的應聘者是否有業務sense?通過我的觀察,對國內網際網路大公司而言,主要是四個方向:
- 學校和專業背景(偏數理的理工科或經濟類為佳)是否有競爭力;
- 是否有相關的實習經歷;
- 描述自己經歷時和回答問題時的邏輯性和框架性;
- 對當前網際網路時事新聞的見解是否有趣而獨到。
問題二
假如我現在已經有心儀的公司了,我該如何判斷這個公司的工作內容,
更進一步地,判斷自己需要掌握哪些技能?
一個簡單的方法是直接去應聘網站看JD(崗位描述),但這個方法並不是特別通用。在我看來,不妨從 公司型別、公司規模、公司業務、公司階段、公司風格 這五個維度來判斷「資料分析」崗位所需要的技能。如下圖所示:
1. 公司型別
在不同型別的公司裡,資料分析師的工作是完全不同的:
- 對於傳統公司而言,資料分析師更接近於「業務分析師」,他們不需要處理太多的原始資料,更多地需要將已有的資料整合和分析,從而支援業務發展,對於這類公司來說,統計學是重要的,而 Excel/R/Tableau 等處理資料的工具也是有必要學習的。
- 但對於很多網際網路公司而言,資料分析師可能需要處理更多原始資料,所以SQL/Python/Java 等資料清洗的工具顯得更重要一些。
2. 公司規模
小公司和大公司的「資料分析師」做的事情「廣度」有明顯差別。
對於大公司而言,業務分工比較明確「資料分析師」是一系列不同的崗位:
- 離原始資料最近、離業務最遠是 資料倉儲工程師(它有很多別名,如:資料工程師/資料融合工程師/ETL工程師等等),他們的工作主要是把技術從使用者和商戶這裡提取的行為資料進行清洗和預處理,使其結構化,是更接近於技術的崗位,相對來說,工作會比較單純一些。
- 距離原始資料較遠、離業務較近的是 商業資料分析師(又稱:Business Intelligence,BI),他們的工作是提取正確的業務資料,並製作報表和具有洞見的分析。這類崗位可能需要處理很多繁雜的資料口徑、需要會 SQL,根據公司的報表體系需要會 Tableau/Excel,但更重要的是能給業務方有效的輸入。也正因為這個崗位連結了資料和業務,所以需要非常強的「協同能力」。
- 距離原始資料和業務都不近不遠的資料崗位主要是 資料探勘工程師 (也有一些分支,如:演算法工程師、機器學習工程師等等),這些崗位往往不需要接觸最原始的資料,也不會在業務的最前線,但通常需要給業務提供一些間接的能力,比如判斷能力(如:兩個使用者的關係是否為同學)、預測能力(如:預測會產生業務風險使用者)、識別能力(如:判斷一張圖片是否為貓)等等。這類工作本身比較獨立,很有創造性,但要求也比較高。
但對於小而精的公司而言,「資料分析師」的崗位分工可能就不那麼明確了。因為人手有限,公司不能為每一個工作職能制定對應的崗位,所以希望能招一個「全棧資料分析師」(更酷的說法是:「資料科學家」)。從資料提取到展現結果的每一個環節,「全棧資料分析師」都需要十分清楚,所以綜合能力比較強的員工才能勝任。
3. 公司業務
公司業務對「資料分析師」崗位的工作內容有不小的影響:
• 在垂直的或者說業務比較集中的公司中,資料的來源以及型別相對比較少,我們在資料預處理上不需要太多的精力,更注重資料的使用和多維度展現,挖掘有價值的資訊,這個崗位是比較有探索性的,更接近於「資料探勘工程師」。
• 但在業務繁雜的公司裡,「資料分析師」的地位比較微妙。業務繁雜意味著變動比較快,這使得一般意義上的「資料分析師」往往無法長時間地做相同的業務(一直對接同一業務的分析師我們一般叫做「行業運營」(不要覺得運營崗位不夠高大上,事實上優秀的運營也很擅長資料分析,對公司的價值很大),所以快速產出資料的能力就變得尤為重要了。此外,在這種情況下,我們需要優質的資料體系,更進一步地,需要「資料產品」。像 Tableau 就是非常優秀的資料產品,很多大型的公司也會去設計自己的資料產品,以滿足業務的需要。有了做資料產品的需求,我們就多了兩類新的職位,一個叫「資料開發工程師」,一個叫「資料產品設計師」。
4. 公司階段
公司所處的階段會影響「資料分析」工作的方向:
- 對於初創公司來說,整個資料體系尚未建立,關於資料通常是要啥沒啥,在這個時候,你就別指望能使用模型去做什麼高大上的分析了。配合技術去找到正確的資料才是你的首要任務。這個工作看起來枯燥,但卻異常重要,如果你能做好,很快就會有機會成為公司最不可或缺的員工之一——畢竟,對於公司所有的資料,你是唯一的出口。
- 而對於成熟公司來說,底層資料體系已經搭建得很完善了,對於初級員工來說,你根本不需要修改啥。想要的資料,基本只要有耐心,都能搞得到,但在口徑的尋找上,可能會非常費時費力,清洗資料需要花費你很長的時間。不過,彙總完一大批資料,不就可以上高大上模型了嗎?演算法、機器學習什麼的,都可以用上,你可以盡情地在資料的海洋中遨遊。
5. 公司風格
最後說說公司風格。和資料分析師相關的公司風格有兩類,一類是「資料驅動」,一類是「業務驅動」。
對於「資料驅動」的公司來說,我們會先看足夠多的資料,再從資料中找到有意思的點,然後進行分析來決定未來要做什麼業務;對於「業務驅動」的公司來說,我們先決定要做什麼業務,然後再決定要什麼資料。
這種風格上的差別會使得資料分析師的地位產生巨大差別。在「資料驅動」的公司裡,資料分析師的地位很高,因為公司的 KPI 是由你來決定的。而在「業務驅動」的公司裡,呵呵,如果沒有優秀的領導者帶領,資料分析師一不留神就會淪為「取數機器」。
一個不太好的訊息是,如今在國內,資料驅動的公司少之又少,尤其在一些大公司裡,雖然它們自稱是「資料驅動」的,但事實上,資料分析師常常被業務牽著鼻子走,位於附屬的地位。所以,在真正工作之前,如果有機會的話,還是建議先實習,避免遇到坑。
好了,看完了上面內容,你大概就會知道自己究竟想做什麼型別的資料分析師,在學習時也就可以有的放矢了。
問題三
如果我真的是零基礎,該如何入門呢?
回到開頭的回答,很多答主推薦了一堆書,什麼《深入淺出資料分析》《深入淺出SQL》等等,這些書當然不錯,不過據我觀察,看書自學比較適合有天賦的人,大部分人很難有的放矢地只通過看書學好,對於真正的小白來說,通過線上學習平臺是從零學習快速入行的首選方法。預估大約花 300 小時,就可以有不錯的基礎了。
至於平臺選擇,雖然國內教育平臺正在蓬勃發展,但我還是更傾向於海外平臺,因為它們起步更早,發展得也更充分一些。
Coursera 是眾所周知的,資料分析的課程也挺多,適合各種不同需求的人,開課的講師大多為北美名校教授,課程對知識的講解會比較到位,但大部分課程是全英文的,對很多英語基礎不太好的小白來說有點小障礙;
優達學城(Udacity) 同為三大線上平臺,課程的質量也很高,講師大都來自矽谷網際網路巨頭,比如 Facebook 和 Google,課程有完整漢化。學完後在找工作方面比學院派的 Coursera 更有針對性,而實戰專案和其提供的中文助教和導師服務也能協助學習,以「資料分析課程」為例,入門就可以從零掌握 Python/SQL/統計學基礎。
進階課程則進一步涉及到 R/Tableau 等,總共花 300 小時左右認真學完和吸收以後,資料分析的基礎可以打得非常紮實。而對於上文提到的大網際網路企業中的「商業資料分析師」,也有無需學習任何程式設計的對應課程,滿足這樣的崗位需求。
立即加入7天試學: Udacity 【資料分析師】奈米學位
13周入門資料分析,學會用 Tableau、Python 和 R 創造最佳的資料解讀
打好基礎,再針對自己想要去的公司和崗位學一些進階課程。那麼,只要學歷背景不算太差,那麼憑自己精心打造的「技能樹」成長路線,到大部分公司勝任絕大多數資料分析師初級崗位應該是沒有問題的。
當然,無論是學習什麼課程,完整地學一遍下來都不是一件輕鬆的事。但畢竟是職業選擇,慎重一些、認真一些,多花一些精力甚至是金錢,也絕對是值得的。
矽谷大學讓你在業餘時間掌握新技能
Udacity 優達學城的創始人是 Google 無人車之父 Sebastian Thrun,與 Google、Facebook、亞馬遜等全球領先企業聯合打造了一系列前沿技術課程,並提供人工專案審閱、一對一線上答疑等學習服務,旨在讓每個人都能用遠低於線下教育的成本矽谷最新最熱技術教育,幫助學員成為能驅動企業創新變革的搶手人才。