【譯Py】資料科學麵試終極指南(五)

呆鳥發表於2019-02-25

招聘經理的想法

Will Kurt(Quick Sprout公司)訪談

Will Kurt

個人簡介:Will Kurt是Quick Sprout的資料科學家。他的興趣是概率論、寫作和Haskell。他的部落格地址是CountBayesie.com,或通過@willkurt在Twitter上與他聯絡。

招聘新人的時候,你關注哪些方面?

  對我來說,把創造力和好奇心這兩種心態結合起來最重要。在創業公司裡,每天不同職能領域都會出現各種新問題。這個月你可能在幫產品團隊新增新功能,下個月就有可能幫銷售團隊改善銷售流程,再下個月,又有可能幫營銷團隊重組測試設定。最理想的求職者要對公司裡所有與資料相關的問題都感興趣,能不斷思考各種型別的資料解決方案。

你對參加資料科學麵試的人有什麼好建議?

  根據我的經驗,所有值得效力的小公司和創業公司都對資料科學家的加入感到開心。他們希望新人的資料科學技能和經驗能解決一直以來讓人頭疼的問題。搞清楚面試問題,和他們一起解決問題,調動他們的興奮點。抓住機會詢問他們在解決什麼問題,讓他們和你一起頭腦風暴,找出解決問題的方法,證明你有能力讓他們的日子更好過。要知道,技術高超的求職者很多,但是關心應聘公司的問題,對之感興趣的人很少。讓面試你的每個人都喜歡和你一起工作,他們就得求著你入職了。

面試時,你喜歡問什麼樣的問題?你想考核的是什麼?

  我關心的是求職者想問題的思路。在Kissmetrics,我提出過一次開放式“家庭作業”任務。這個任務很簡單,構建一個分類器就可以了,我和求職者說了這一點,不過,我還告訴他們,我還想通過這個測試看看他們能不能搞點標新立異的東西出來。這個任務的答案不一定很長,或很複雜。我想要的是,求職者要進行交流,表現出好奇心,找出有價值的東西。

  這些求職者都會程式設計,對線性代數、微積分和概率論也很瞭解,具有學習相關知識的基礎,技術從來都不是問題,但是教他們創造性思維,讓他們積極主動地解決問題就非常困難了。

Kissmetrics和Quick Sprout招聘資料科學家時有什麼不同?

  目前,Quick Sprout團隊很小,處在產品開發的早期階段,暫時不需要招聘資料科學家。不過,有經驗的人應該知道許多創業公司或小公司一直都在招資料科學家,只是因為招聘過程太浪費精力,所以暫時沒有開始正式的招聘工作而已。我在Kissmetrics遇到過一個人,他是我見過的最讚的求職者,有一天,他跑到公司門口,跟我們說:“我想來你們這裡工作!”。

  學術界或大公司的人可能不知道創業公司和小公司的招聘有多靈活。如果你認為一家公司的業務很酷,就他們聯絡。對於一幫熱愛自己事業的人來說,告訴他們你喜歡他們乾的事,真心想加入他們的團隊,沒有什麼比這個更讓人印象深刻的了。就算這家公司暫時不打算招人,等他們開始招聘的時候,你肯定會是第一人選。

Matt Fornito(OpsVision Solutions公司)訪談

Matt Fornito

個人簡介:Matt Fornito是資料科學家與技術帶頭人,他在資料研究、資料分析和管理領域有十多年的經驗。學習精神和敬業熱情使得他不斷成長進步。這篇訪談根據和Matt的電話記錄整理。

招聘新人時,你關注的重點是什麼?

  我喜歡招聘有量化知識背景的人,他們可以學習程式設計,但是不用再學這些專業知識了。對我來說,碩士或博士學位非常重要,本科生達不到我的要求,考個本科對大多數人來說都不是什麼難事。我喜歡招聘能程式設計、會溝通的人,能明白技術問題是制定、執行方案和溝通想法的關鍵。我認為,資料科學家和資料分析師的主要差別就在於,資料科學家能深刻理解資料問題,還知道怎麼解決這些問題。

  我還喜歡招聘數學、統計學、化學,物理學、生物資訊學和工程學專業的碩士或博士。只有少數MBA專業的人和能我配合好。其實我本人是組織心理學專業的博士,所以,儘管我喜歡有STEM(科學、技術、工程、數學英文首字母縮寫)背景的人,但也不一定非得侷限於這些專業。

你對參加資料科學麵試的人有什麼建議?

  招聘人員在意的是教育程度、簡歷上列出的最後兩份工作,還有行業背景。人力資源的人看簡歷非常快,因此,求職者必須在幾秒鐘內吸引住他們的眼球。條件允許的話,我建議最好去Facebook這樣的一流大公司工作,或者去創業公司當個高管,這種行業背景能讓人輕鬆地脫穎而出,找到高階資料科學工作。

  對於“給我講講你做過的專案”這樣的問題,招聘經理經常會問求職者曾經做過什麼 — 處理過什麼樣的資料,使用過什麼樣的工具,產出了什麼樣的成果,說清楚這些問題十分重要。成功的求職者對做過的工作把握的很準,能清晰地講述專案經歷,還能說清楚他們對業務產生的影響。

你會考察哪些內容?

  面試時,我一般會圍繞一個專案測試求職者解決問題的能力和溝通技巧。我還會評估求職者對我們公司和資料科學的熱情。有堅持學習的動力、熱衷於解決問題是我考察的關鍵。在技術方面,我對能用Hadoop和Spark優化資料結構,能評估各種資料科學解決方案的求職者感興趣。他們能不能像資料科學家一樣思考問題?做沒做過資料科學工作?這些都是我希望通過面試瞭解的主要問題。

  我還會問些數學問題,比如,梯度下降、統計技巧,還有隨機森林。我還會設計情景問題,提出客戶情景假設,瞭解求職者如何與客戶互動。求職者最好會用Python或R程式設計,當然會C ++或Java也可以。我不太喜歡HackerRank這種追蹤解決方案的方式;我寧願測試求職者對從未用過的程式語言的接受程度,以及快速學習的能力。我招聘的人必須能學習新技能,這是我考察的重點

Andrew Maguire (PMC/谷歌/Accenture) 訪談

Andrew Maguire

個人簡介:Andrew具有7年的資料分析與資料科學工作經驗,在不同行業分別擔任過各種資料科學角色。現任Penske傳媒公司的資料科學家,專門負責資料工程架構與應用業務分析工作。此前,他曾在谷歌(市場分析、資料質量)、埃森哲創新分析中心(顧問),還有怡安創新分析中心(產品開發團隊)工作。

招聘新人時,你關注的重點什麼?

  除了技術、經驗這些基本要求,我覺得具有不斷學習新事物的激情、意願和能力是關鍵。

  態度端正也很重要,如果求職者能把自己的優缺點都說清楚,我覺得這樣就很好,我不喜歡太能吹的人,謙虛才是美德。

  親和、開放和真誠是“團隊匹配”的關鍵。求職者不用什麼都懂,但要能和其他人一起工作尋找解決方案,這點非常重要。

你對參加資料科學麵試的人有什麼建議?

  對於技術問題,要多花點心思,寫清楚解答思路,還有就是一定要把面試問題搞清楚。另外,有問題就問,別害怕告訴面試官沒接觸過某些領域,或者不熟悉某些演算法,他們不會因為這個就篩掉你。作為資料科學家,承認自己知識有限非常重要,堅持學習才是最重要的能力。

  準備兩到三個資料科學專案的“故事”,和麵試官聊聊問題規劃、資料清洗、資料分析、資料視覺化,以及與各部門溝通資料洞察結果的事情。處理好技術宅男與業務大拿之間的平衡,表現出對業務的深刻見解。這些“故事”可以是以前公司裡幹過的工作,上大學時的作業,甚至還可以是業餘做過的專案。要學會從面試官提出的問題裡找到機會,把話題引到自己的經歷上,用具體例子和實戰經驗證明自己。

  我發現瞭解求職者最好的辦法是讓他們詳細介紹以前做過的專案,所以,一定要想辦法讓面試官對你在簡歷上提到的專案感興趣,願意主動了解你做過的事情。

面試時,你喜歡問什麼樣的問題?你想考察的是什麼?

  處理過最大、最複雜的資料集是什麼樣的?處理資料時遇到過什麼問題?我一般會探討這些問題,瞭解求職者的資料清洗技能與經驗。

  舉例說明,如何分析資料集?如何與業務方溝通分析結果?資料分析時遇到過哪些問題?產出了什麼成果?對業務產生了什麼影響?要說明提取業務洞察和與相關方溝通等方面。

  我的問題主要和簡歷相關,要是問以前工作中做過的專案,我會問解決過什麼問題,使用過哪些資料,怎麼使用資料,分析結果是什麼,怎麼把分析結果擴充套件到其它業務領域。所以,一定要謹慎選擇在簡歷上寫的內容。如果覺得內容太多,兩頁紙寫不完的話,就得考慮針對不同型別的崗位定製不同的簡歷。

  最後,我會讓求職者講個失敗的例子,說說什麼地方做錯了,以後遇見類似事情怎麼改進。這個問題是我從《人力資源百問百答》裡看到的,不過我也喜歡看求職者如何回答這個問題 ?

谷歌招聘資料科學家和業界其它公司有什麼不同?

  我覺得都差不多,總的來說還是看具體崗位。要是非常專業的崗位,比如研發崗或研究員,問的技術問題就會更細,對專業領域問題也會鑽得更深。對於通用崗或業務崗,主要關注技術水平、業務理解力、團隊配合度以及溝通能力的合理搭配。

  谷歌與其它公司最大的不同就是面試次數多,面試官的人數也多,至少有6個人參與面試,從各個方面考察求職者。這些人會從不同角度評判求職者的優缺點,而且必須綜合考量求職者的能力和水平,給出是否同意招聘的結論。表現出良好的綜合能力,比偏科要好的多。這時候,求職者的態度和親和力非常重要,就算在某些方面有短板,只要面試官欣賞你,覺得你能在幾個月內快速跟進,工作就有戲了。

Hirsto Gyoshev(MasterClass公司)訪談

Hristo Gyoshev

個人簡歷:Hristo Gyoshev是MasterClass公司的商務運營戰略部主管。MasterClass是一家快速發展的創業公司,致力於普及天才教育、重塑線上教育。他曾在消費型網站(雅虎)和企業級SaaS公司從事公司戰略、商務運營及產品戰略等工作。MasterClass長期招聘資料科學家和相關崗位,詳情可登入careers.masterclass.com檢視。

招聘新人時,你重點關注什麼?

  我們要找的是核心人才,目標人選要對各類資料專案有強烈的慾望,不管是量化市場研究、使用者調研,還是統計與商務智慧分析都要能夠勝任。他們還要樂於學習,遇到瓶頸時,能積極推動專案的進展。

  要說教育背景與工作經驗,我們希望求職者首先要有足夠的統計學知識,能判斷統計推斷是否有效,能識別並且避免偏差;第二點是,要有滿世界採集資料的能力,採集回來的資料基本上都有一大堆問題,他們還要有意願、有能力處理這些資料,並分析出可行的洞察結果。

  求職者要有強大的量化分析背景,能用Excel、SQL、Python或R處理和分析資料,還要有社會科學以及市場/使用者研究的經驗(學術或工作經驗都可以),進行商務分析和撰寫資料包告的經驗也是必須的,我心目中的求職者要具備這些條件。

你對參加資料科學麵試的人有什麼建議?

  儘量理解面試問題,搞清楚問題背後更高層面的背景知識。面試時,對資料分析、構建模型的考核,一般都源於公司希望求職者能幫我們解決特定的問題。有時你會發現你解決不了這些問題,有時你恰巧能提出更好地建議。如果一開始就能清楚地理解我們這些“客戶”到底要分析什麼,你給出的分析、模型或產品就會更切題。一旦應聘成功,面試時問到的這些問題很可能就是日常要做的工作。

面試時,你喜歡問什麼樣的問題?你想考察的是什麼?

  我們想了解求職者以前都幹過哪些型別的工作,看看這些工作經歷和我們招聘的崗位是否相關。我們還會了解求職者以前做過的專案,讓他們講講解決問題的方法、思路、用過的工具、遇到過什麼難題,還有就是怎麼解決這些問題。

  我們還會讓求職者做些小專案,看他們怎麼處理特定的問題,當然,這也是為了考察他們的工作質量。

MasterClass招聘資料科學家和別的公司有什麼不同?

  和其它公司相比,我們很少用到機器學習和演算法,資料清洗的工作也不多,主要是圍繞公司的產品、業務和運營部門,為他們提供各種分析決策支援。工作內容主要包括匯入、處理、分析來自不同系統的資料,構建各種預測模型;設計、實施、分析各種調研與測驗;協助業務部門定義、設計資料包告與指標;為業務運營等部門做出各種一次性資料分析。

  因此,我們不需要求職者特別熟悉機器學習或演算法,但我們希望他們能熟練掌握資料分析的各方面知識,能處理各種資料分析工作。還有,我們希望求職者具有學習新工具、新方法的意願和能力。

結論

  招聘經理希望求職者能夠展示:

1)對該公司的興趣和對資料科學的熱愛;

2)合群,這點甚至能彌補技術能力不足的弱項;

3)強烈的學習意願,快速學習的能力;

4)以往專案的成功經驗,對專案的影響力;

5)強大的分析能力。

  接下來,看一看面試桌的另一邊,已經當上資料科學家的求職者是怎麼說的。

求職者的成功經驗

Sara Weinstein

Sara Weinstein

  波音航空資訊(加拿大)公司 資料科學家, Springboard學員

你對通關資料科學麵試有什麼建議?

  首先說一下面試準備,我覺得當初應該多瞭解一下分析策略。當時,我在統計學、概率論、機器學習、Python/R這些技術方面下了很大功夫,結果卻被一個處理指定資料集的問題搞得束手無策,這個問題其實不難,但我沒有發揮出正常水平。我太在意“硬”技能了,沒重視更高層面的方法論和策略。

讓你覺得意外或很難的是什麼?

  面試過程太長了。當時我已經猜到會有多次面試,實際上整個流程下來一共面試了三次,每次面試間隔一個禮拜,再加上背景調查,從開始接觸到拿到Offer一共用了一個月。搞得我壓力山大,整整一個月都要積極應對、保持自信、做好各種面試準備,這可是個不小的挑戰。要是早知道耗這麼長時間,我就能輕鬆點了。我給參加漫長、多重面試的朋友的建議是,冥想是個好東西。冥想能讓你晚上睡個好覺,還可以讓你面試前保持冷靜和自信。

Niraj Sheth

Niraj Sheth

  Reddit公司 資料分析師,Springboard學員

你對通關資料科學麵試有什麼建議?

  我覺得吧,面試前應該多看點兒統計學基礎。有點傻了吧,不過面試官動不動就是I型錯誤、II型錯誤這些東西。看自己的時間吧,要我說最好找本兒統計學的書,起碼把裡面的名詞都給搞清楚嘍。

  真不是我說,面試那會兒我都驚了,這幫兄弟評估專案經驗的水平真不咋樣。一說幹過的專案,就會問利息值,資料分析說的事兒真那麼有趣兒嗎?^4。就沒人能問點兒有噔次的問題。

  我還幹過點兒效果不錯的事兒。其中一件事兒是我整了個倍兒easy的視覺化例項專案,就是上傳到GitHub內種,不過您可別就只上傳一個Readme檔案,那就漏了怯了。這個專案不一定多花哨兒,能跑起來就成,比方說,我這個專案就是個霧霾預測地圖。搞點這種東西,在找工作時能頂不少事兒。

  另一個事兒就是跟面試官要資料集,回家完成測試任務。我不知道您水平有多高,不過就說我自己,當然還有不少非科班兒出身的哥們兒,都對現場資料分析灰常頭疼。反正我沒那本事。但,我知道這會兒該怎麼辦,我會跟面試官說,您能多給我點兒時間嗎,我回家琢磨琢磨,肯定能把這個問題搞定了。

Sdrjan Santic

  Feedzai公司 資料科學家,Springboard講師

Sdrjan Santic

你對通關資料科學麵試有什麼建議?最難的問題是什麼?

  我覺得最難的問題是理解主流的監督與非監督學習演算法如何執行,還要用簡潔的語言進行說明。掌握好資料科學術語是關鍵。求職者還得全面瞭解精確度指標和各種評估方法,比如,訓練測試集、ROC曲線、交叉驗證什麼的。更麻煩的是讓你把這些問題在白板上用數學方法寫出來。

你的面試過程順利嗎?

  必須。。。非常順利!基本上我面試就跟和同事聊天一樣,沒覺得有什麼壓力。我應聘的公司效率很高,一個禮拜就搞定了整個流程。還有一點是,就算有些公司沒錄取我,也會非常坦誠地告訴我原因,這點讓我印象深刻。

你選擇現在這份工作的決定因素是什麼?

  總的來說,這裡讓我有機會使用各種技術工具,還可以解決各種以前從未遇到過的問題。我以前的工作主要就是構建模型。資料都是經過預處理,清理好的,做的探索性工作也僅限於使用商用圖形介面工具。我覺得我的資料清洗技能和命令列操作水平在不斷退化,我要到能動手實幹的環境裡歷練。

結論

  已經成為資料科學家的求職者提到的共同點如下:

1)別認為面試不考基礎知識,最好讀點統計學基礎;

2)準備好應對非技術層面的考核。除了統計學和程式設計,面試還會考核溝通技巧、團隊合作等軟技能;

3)準備自我介紹,包裝自己,說清楚你有多麼熱愛資料科學、掌握了哪些資料科學技能,可以為公司帶來什麼樣的獨特價值。說清楚你具備什麼樣的資料科學專案經驗,對專案的貢獻,這些都會幫助你進入面試下一關;

4)要有耐心。資料科學麵試流程一般都比較長,要做好持久戰的準備。

  至此,我們已經講述了資料科學麵試實戰流程的全部內容,下面,看一看面試之後會發生什麼吧。

相關文章