資料科學家面試如何準備?

九章演算法發表於2017-09-12

專欄 | 九章演算法
網址 | www.jiuzhang.com

資料科學家(Data Scientist)被《財富》雜誌譽為21世紀最性感的職業。據調查顯示,僅僅在美國市場,2018年大資料和高階分析相關人才的缺口就將高達19萬。然而雖然現在很多人對這份職業躍躍欲試,但是卻對這份新興職業並不瞭解,更不知道應該如何準備面試。

下面我們就來簡單介紹一下什麼是資料科學家,以及我們應該如何準備資料科學家面試,希望能對想要從事這一職位的朋友有所幫助。

什麼是資料科學家

“資料科學家”在2009年由Natahn Yau首次提出,簡單來說資料科學家就是指能採用科學方法、運用資料探勘工具對複雜多量的數字、符號、文字、網址、音訊或視訊等資訊進行數字化重現與認識,並能尋找新的資料洞察的工程師或專家(不同於統計學家或分析師)。

一個優秀的資料科學家需要具備的素質有:
懂資料採集、懂數學演算法、懂數學軟體、懂資料分析、懂預測分析、懂市場應用等。

在初步瞭解了資料科學家這一概念後,我們來重點研究一下應該如何準備資料科學家面試。

如何準備資料科學家面試

1.瞭解你申請的崗位所需的技能

資料科學家這個職業的定義很廣泛。在不同行業不同公司,即使崗位名稱同樣叫做資料科學家,他們的工作內容也可能是不一樣的。這也就是說這個職業有很多分類。

比如:
如果這個職位對你的程式設計能力要求很高,那麼,建議你看一看與軟體工作師有關的面試題。

如果這個職位要求你有很高的統計技術,並且需要你瞭解不同的人口分佈、懂得如何設計實驗、熟悉如何設定A / B測試和假設測試等,你就要對這些內容進行學習和練習。

所以在面試前,你一定要明確你申請的崗位所要求的技能和職責,因為這決定著你面試時會遇到什麼樣的題目。

2.向招聘人員詢問面試流程

向招聘人員詢問面試流程,瞭解準備面試時可以使用哪些資源以及面試時的著裝要求。

可以的話,詢問一下面試官的姓名,這樣你就可以在網上查詢他們的相關資料,從而瞭解他們的專業領域等資訊,並就此作準備,會起到事半功倍的效果。

3.在網上查詢以往的面試題

你可以在網上查詢你將要面試的公司資料科學家這一崗位的相關面試題,包括行為問題和技術問題。

就算你找不到你將要面試的公司的面試題,你也可以看看其他公司的面試題,讓心中對面試問題的型別有個大體瞭解。

4.提前準備好行為問題的答案

在面試前你要提前準備好你可能遇到的行為問題以及這些問題的答案。

比如說你可能遇到這些問題:
你對要工作的內容感興趣嗎?
你會如何對待團隊工作?
你願意做一些煩人的工作嗎?比如清理雜亂的資料。
在這個行業,每個公司都想努力解決的問題是什麼?你和你的團隊將如何發揮作用?

想要回答好這些問題,你可以查詢相關資料並結合自身經驗在面試前準備好這些問題的答案,這樣當你面試過程中遇到這些問題時,你就能邏輯很清晰的表達出來。

5.仔細閱讀招聘要求

檢視你那份工作的招聘要求,從中挖掘出你的優勢和興趣。並在面試官根據這些要求提問時說出你的興趣和優勢。這樣不僅能體現出你對這份崗位的精準瞭解,而且能表現出的你的專業能力,從而讓你在面試中脫穎而出。

比如:
招聘要求:精通X語言。
面試時:可突出——我本身會Python,所以我學公司要求的X語言是很快的。

招聘要求:會用不同的NLP模組分析文字。
面試時:可突出——我很擅長用不同的NLP模組分析文字,並加以舉例。

招聘要求:熟練掌握web-scraping和web-pages-inspecting
面試時:可突出——我會用web scrap和查詢web頁面寫一個爬蟲,並舉例。

招聘要求:能在SQL和NoSQL資料庫找資料。
面試時:可突出——我很擅長在SQL和NoSQL資料庫找資料並基於這些資料分析模組。

6.熟悉你的專案經歷

每輪面試前,重溫一下自己的簡歷。因為,大多數面試官會根據你簡歷上所寫的專案進行提問。所以,做一個perfect的總結至關重要。

準備工作:
翻看你的專案資料,回顧一下技術細節。
準備一下你在設計專案時使用資料科學的過程,裡面需要包括:你為什麼選擇這個方法、你對專案的個人貢獻、你遇到的挑戰、你在這個過程中學到的東西。
多加練習,確保你的總結是連貫的。

7.程式設計(通常要求在白板上寫)

如果你的工作職位需要考察程式設計能力的話,那麼你需要開始以下的準備工作:

掌握基本的演算法以及資料結構和演算法複雜度。
練習在白板或記事本上編碼,熟悉這種感覺。
練習的時候給自己定時,以免面試時因有時間限制而過度緊張。
如果沒有太多軟體工程經驗,可以找精通的朋友幫忙。

面試時:
確保你完全理解題目意思,不清楚的地方要提前問面試官。樣式
寫程式碼前,先將方法告訴面試官,讓他們可以對你的設計提出優化建議,從而節省時間。
除非面試官提出,不要寫到一半去檢查無效輸出。一般情況下,面試官不會在意這個。
寫完程式碼後,注意檢查一下變數初始化、結束條件和邊界情況。

8.瞭解和應用機器學習理論

有的資料科學家職位對機器學習知識有一定的要求。

機器學習理論將測試你對基本機器學習概念的理解,一般側重於監督式學習。

對於機器學習理論,你應該瞭解:
監督式學習系統的一般設定
為什麼要將資料分為測試集和訓練集
如果根據樣本資料不能找到普遍規律,那麼該怎麼辦?(參考答案:用不同的樣本資料或者投射到更高的維度空間)
如果樣本資料太多太雜該怎麼辦?(參考答案:對其進行正規化)

此外,面試官也可能考察你的應用機器學習的能力。通常,面試官會讓你想一個演算法實現一個預測類的題。

比如:怎麼找出可以推薦給使用者的書?
回答此類問題,要明確:
物件是什麼?
可以用的機器學習演算法有哪些?
內容列表樣式

根據問題的定義,對不同的可能情況擴充套件更多的解決方案,問題就迎刃而解了。
對你的聲譽和職業生涯產生影響。


推薦閱讀:



歡迎關注我的微信公眾號:九章演算法(ninechapter)。
精英程式設計師交流社群,定期釋出面試題、面試技巧、求職資訊等

九章演算法,IT教育領域的深耕者
九章演算法,IT教育領域的深耕者

相關文章