【譯Py】資料科學麵試終極指南(七)

呆鳥發表於2019-02-26

歡迎來我的簡書:呆鳥的譯Py胡言

資料和資料

  如果提出的薪資在平均線左右,談判就會比較順利。要是再能提供些詳實的證據,你就是談判桌上強勢的一方。

  這裡有一些資料和資料可供你研究。

  Indeed.com公司的資料分析師平均薪資為65,000美元,資料工程師的平均薪資為100,000美元,資料科學家的平均薪資為115,000美元。各地區的收入水平不同,薪資最高的地區集中在技術密集的海灣區。O`Reilly傳媒公司的調研表明,和其它美國地區相比,加利福尼亞的資料科學薪資水平和中位數都是最高的。從全球來看,美國的資料科學薪資水平和中位數是最高的,英國、紐西蘭、澳大利亞和加拿大也相差不多,亞洲和非洲最低。

  科技與社交網路公司裡資料科學崗的薪資最高,教育和非盈利機構給的薪資最低。

  具有不同的資料科學技能,使用不同的工具,薪資水平也不同。O”Reilly對數百名業內人士做過一次調研。研究結果表明影響平均薪資水平的因素很多。比如說,Scala這種擴充套件性語言的使用者薪資中位數超過100,000美元,而SPSS這種專用工具的使用者薪資水平就明顯低得多。

名人名言

  “世界上大多數人做決定,不是靠猜就是靠蒙,運氣好的猜中了,運氣不好就猜錯了。” — Suhail Doshi,Mixpanel公司CEO

  “所有企業都告訴經理人要全力支援資料驅動分析。問題是,資料只代表過去。所以,我們教給經理人和顧問的是做決策與分析問題的方法,事到臨頭才行動的思想是被人唾棄的。” — Clayton M. Christensen,哈佛大學管理學教授

  “我們已經進入了資料比軟體更重要的時代。” — Tim O’Reilly, O’Reilly傳媒公司創始人

  “使用者希望快速、簡單地獲取資料,他們才不關心網站吸不吸引人,設計的漂不漂亮。” — Tim Berners-Lee

  “資料科學家要乾的事情就是採集資料,把資料變為可追蹤的形式,用資料講故事,再把這些故事講給別人聽。” — Mike Loukides,O’Reilly傳媒公司副總裁

核對清單

1)列出和求職崗位匹配的技能;

2)列出希望就職的行業和公司型別;

3)準備領英、求職信和電子郵件模板;

4)全面研究求職目標的公司和崗位;

5)主動聯絡這些公司的職員,爭取資訊化約談機會;

6)搭建人脈圈,爭取工作推薦機會;

7)搞定資料科學麵試;

8)不要放棄希望;

9)入職談判。

模板

爭取資訊化約談


【姓名】,您好:

  我對Airbnb的資料科學問題非常感興趣,同時非常希望能進入這一領域,我還是Airbnb Nerds部落格的忠粉,我發現使用資料建立信任感是驅動Airbnb成功的核心。基於我在心理學與統計學方面的背景,或許我能提出些獨具創意的想法,幫助你們強化客戶信任。

  希望能有幸請您一起喝杯咖啡,瞭解下Airbnb的資料問題,說不定我能幫上忙!
祝好!

【你的名字】

【祝辭】【為什麼對這家公司感興趣】【喜歡這家公司的什麼業務】【能在哪些方面幫上忙】


找人推薦工作

【對方的名字】,您好:

  很高興在上次百樂餐會時認識您。我最近在找工作,我對優步的業務很感興趣,特別是優步資料科學團隊面對的那些問題。能幫我介紹一下你們的招聘經理或者資料團隊的人嗎,我想看看有什麼能幫得上忙的地方?

祝好!

【你的姓名】

【祝辭】【說明最近在哪裡見過面】【談一下對這家公司的興趣,或特定的問題】【請求幫忙介紹招聘經理,看看有沒有能幫忙的地方】


面試後的跟進

【面試官的稱謂】,您好:

  很高興能和您討論谷歌的資料科學問題,我覺得您提出的問題裡,有一些問題我能幫忙解決,如果可能的話,我希望能參加下一輪面試,謝謝!

【面試官稱謂】,您好:

【討論幫忙解決的問題】【表達想進入下一輪面試的意願】


術語庫

A/B分割測試:A/B分割測試是網路公司設計實驗的黃金標準,兩組使用者分別對應不同的條件,測量他們達到特定目標的轉化率。理想狀態下,網路公司會專門做A/B分割測試,並會提供對這個概念進行指導。

貝葉斯法則:貝葉斯思維和推斷依賴於偏差與方差。(具體的請自己找資料學習)

特徵:某個物件的一組資訊,通常是表格型資料中的一列。比如某個人的身高、體重和性別,就是三個特徵。

生命週期價值:一個使用者在一定時期內在某公司消費所產生的預期收益。比如,某家服務型創業公司按月收取軟體費用,用每月價格乘以每月付費人數就能得到當月的預期收益。

MapReduce:儲存大規模資料集的演算法,資料分為多份存在不同伺服器上,但處理時卻像是對一個完整的資料集進行操作,這種方式可以減少處理大規模資料集的難度。MapReduce使用平行分散式邏輯處理大規模資料集。

過擬合:擬合曆史資料趨勢的模型,如果歷史資料影響太大,就會導致洞察結果的過度歸納,致使預測結果不夠精準。

I型錯誤:假陽性指錯誤地認可事情發生了,比如說,認為男人懷孕了。用技術用語來說就是,對零假設的錯誤拒絕。

II型錯誤:假陰性指錯誤地認為事情沒有發生。比如說,認為孕婦沒有懷孕。用技術用語來說就是,對零假設的錯誤接受。

  想了解更多術語,請查閱這個資料科學術語庫

資源

KDNuggets網站上解讀面試過程幕後真相的搞笑漫畫。

資料科學麵試解密這本書提供了很多面試習題。

Data Science Interview Exposed

  資料科學手冊,中文版叫資料科學家訪談錄,京東有售。本書給出了很多資料科學家的實戰建議,分析了是什麼造就了優秀的資料科學家,還有不少在面試過程中發生的奇聞趣事。與之配套的資料科學麵試指南一書中列舉了120個資料科學麵試時會遇到的問題。

資料科學家訪談錄

  破解程式設計面試一書是軟體工程面試的權威讀物,可以幫助求職者通過資料科學麵試的程式設計部分。

Cracking the Coding Interview

  Quora的這個帖子介紹了Airbnb怎麼招聘資料科學家,這是一位資料科學領軍人物對資料科學麵試的深度解析。

  Trey Cause揭祕瞭如何通關資料科學麵試,他對於資料科學麵試的看法非常重要,也十分坦誠。Erin Shell也討論了她在面試資料科學工作時的經驗。。

“隨著年齡的增長,經驗的增加,我會在面試時反問面試官。我會問面試問題的目的是什麼?或者告訴面試官他們的面試方法不能很好的評估我的技術和能力。有些人可能認為我是不是覺得自己太優秀了,所以才不用回答這些大家都得回答的問題,但是我覺得這是評估、預測和招聘人才的重要一環,我要做的就是通過這種方式表示出我的態度。希望你也能做到這一點。我們在搭建團隊和招聘時,總是認真的思考我們到底想要實現什麼,怎麼才能達到我們的目的,複製很多年前就存在的模式不是我們想要的。”

  這篇文章很有思想,講的是Twitter的資料科學專案是怎麼運作的,介紹了資料科學家的對這一行感悟。

  如果你正在學習概率論,可以參考這個速查表。Quora的這個帖子也能幫你不少忙。

  Ellen Chisa的部落格介紹了她幾次技術面試的失敗經驗;你可以看看,避免犯同樣的錯誤。

  最後,First Round Review有一篇啟蒙文章介紹了怎麼才能招募到優秀的資料科學家;讀一下這篇文章就能知道面試桌對面的人是怎麼想的了。

關於作者

Roger Huang

  Roger Huang是個學霸。他為一家大型醫藥公司做過價值7億美金的銷售資料分析,並由此進入資料科學這一行。他還是Entrepreneur、TechCrunch、The Next Web、VentureBeat還有Techvibes這些網站的撰稿人。

  為了編寫這本指南,獲得資料科學的見解,他採訪了數百名Springboard的資料科學專家,包括Sri Kanajan,本書的合著作者。

  Sri Kanajan現任紐約一家投資銀行的資深資料科學家。他有14年的開發與管理經驗。2013年轉行成為資料科學家。他曾在舊金山參加全日制資料科學訓練營,完成了全部課程,並在兩家創業公司當過資料科學家,到現在這家公司工作前,還擔任過Change.com公司的資料科學主管。他利用業餘時間擔任General Assembly公司資料科學課程的首席講師,熱衷於幫助大家進入資料科學領域工作。

相關文章