原作:How to Consistently Hire Remarkable Data Scientists 譯者:趙斐@北京移動。文章作者是Jeremy Stanley,Sailthru公司的主力資料科學家和EVP工程師,他負責將搭建公司智慧的個性化營銷平臺。他的資料科學團隊致力於預測、推薦及優化演算法。

20150629105905_33223

資料人才們可以處理不確定性。不管我們打交道的資料有多“大”,它含有有限個有偏的潛在樣本。我們的模型在太簡單以至於無實際意義和太複雜以至於無法置信這兩種極端情況間平衡選擇。為了能找到控制資料噪聲的方法,我們不斷嘗試模擬、測試驗證。一個傑出的資料人才能夠對他的資料、方法以及結論保持適度的懷疑態度。

那麼當有一天資料科學家面對出現的全新挑戰:評估將成為他們團隊中一員的面試者。這個樣本空間下降的很快,實驗方法看起來不會那麼實用,面試中的偏差比我們實際工作中精心控制的資料偏差更呈現數量級的顯著倍增。

許多資料人才的領導者藉助於下面傳統的招聘技巧(實際上他們本不該這樣做):

在開始建立我的新團隊時,我與許多資料科學人才溝通收集他們的想法和最佳實踐經驗。 Riley Newman(Airbnb公司的資料科學領導,他設計並實施了招聘資料人才完全不同的方法,他也是我之前溝通過幾次的這套系統的設計人)的想法對我的影響很大。我也從Florida專案中從Drew Conway身上學到了很多,他持續不斷的改進他的資料人才招聘流程,在他著名的資料科學維恩圖上漂亮的落筆正中部(正中目標)。

在這篇文章裡,我將闡釋我所採用的Riley開發的新流程目標,描述它的潛在原則,體驗我們在Sailthru公司所開展的實驗。當然,這個嚮導離開發掘改善的機會同時更好的改進流程將是不完整的。

如何開始一場招聘改革?

在開展我們的招聘流程時,我們設定了以下測量目標:

準確:使新聘員工成為優秀員工的機會最大化

損失:使有好的應聘者過早離開招聘流程的機會最小化

成功:使聘任意向書被接受的機會最大化

努力:減少招聘團隊注意力長期分散機會。

任何有經驗的招聘經理乍一看,都會覺得同時提高這四專案標不現實。前三專案標在實際上是相互矛盾(例如:應聘者越優秀,讓他們接受聘任意向書的困難越大)。除此之外,提高全部目標看起來會給團隊施加更大的前行壓力。

在傳統的招聘流程中,如果他們的準確性高於50%,多數招聘經理會感到幸運。也就是說,他們所聘任的員工最終被證明優秀的機會將不超過一半。損失則很難測量(畢竟流程中失敗的應聘者將不會為你工作),同時多數招聘經理擔心他們會時常失去優秀人才,原因是冗長並困難重重的招聘流程。

在招聘資料人才這種競爭激烈的領域,強有力的應聘者經常會接到3個甚至更多offer,因此成功率通常低於50%。

招聘所需的當下的努力會輕易消耗資料工作團隊20%甚至更長時間。在向其他資料團隊的領導人證實這個實驗,我尋求實施流程能夠達到如下目標:

準確性:90%的新聘員工應該能成為傑出員工

損失:給與80%優秀的應聘者offer,使其通過招聘流程

成功:65%的聘任意向書被接受

努力:招聘只耗損資料團隊10%的時間精力

通過設計更智慧的招聘流程——提高識別優秀應聘者的機會同時降低失去他們的風險——可以同時提高前三專案標。同時,增加早期投資,團隊當下的努力和精力分散狀況將會得以改善。

為了保障達成我們的目標,我們設定了一系列核心原則能夠用以招聘中任何模組。促使每個人聚焦並使其流程化的原則能夠顯著的改善整個流程。這也在你不斷重複這個流程時也成為一個健康的生態基礎。它們是:

1、確保你的招聘流程持續完善。

招聘經常被認為是一個你所偶爾參與的任務或者一場週期性強消耗的閃電戰。相反,將你招聘流程構架為一臺經常運轉的發動機,伴隨人才通過招聘漏斗不斷進入明確的下一步。這保證你不斷招聘,無論優秀的人才何時進入市場,你將都有機會參與。

投資一個常規運轉的流程將要求你將招聘作為鐵律。這將保持協議與結果的一致性,使你能收集你成功和失敗資料,促使你能夠像管理你的資料管道一樣用心的管理人才管道。

用你招聘流程對映你招聘需求的現實情況。

2.無情的事實:標準化的面試問題是致命的缺陷

詢問應聘者他們之前的經驗,你會發現他們是否能夠陳述另一項工作發生了什麼。問他們技術性問題,你會發現他們重新組織知識的能力。讓他們在白板上解決“玩具”一樣的問題,你會發現他們能怎樣快捷的解決玩具問題。一個能夠順利通過所有障礙的應聘者或許在實踐中是完全無用的資料人才。

為了重視這些缺陷,你必須首先對你想要應聘者在實際資料工作做什麼有一個非常清晰的理解。最高的要求是,你應該清楚你的團隊應該最終呈現什麼樣的最終產品。是否它是供決策制定者可視覺呈現和可分析的?設計或者原型是否給予開發者?或者實施者能夠在生產環境中被測量並給與支援?

接下來,你應該對你想讓成功的應聘者做什麼有一個清晰的理解。確定給一個資料人才5個解決問題的機會。對於每一個問題,保證你有(或者應該有理由能收集到)所需的資料,能夠呈現有效的結果(即使你不能親自設計它)。這些機會與你公司的近期目標,你的組織或產品如何可靠運轉,資料的現有或有理由產生的限制相關。

知道你的團隊如何完成資料專案以及你最想讓應聘者能夠處理什麼問題的挑戰,你能設計一個近似反映你的工作條件的招聘流程。這意味著你應該把應聘者放進一個近似代表你們天天面對的環境。如果他們能夠成功的在面試過程中適應環境,那麼他們長期成功的機會將大大增強。

進行目標評估首先要減少你的偏見。

3、有潛力成為最優表現者的應聘者可能會在傳統面試流程中失利

元凶是面試官的偏見。一旦你進入應聘者的面試房間,你就開始形成對他們能力的判定(很可能是無意識產生的)。有很多種這樣的偏見(這裡可查詢100多種認知偏見),但最常見的偏見是偏好那些與我們自己相似的人。

優秀的資料人才必須具備強大的數理及程式設計能力。這一點不折不扣。因此我們首先設計流程來測試這方面,接下來輪到問題解決和溝通能力等更主觀的能力(仍可被測量)。

越到最後階段,主觀原則越多,評估最耗時,也最容易產生評估偏差。使優秀的應聘者能夠在招聘流程漏斗的後部繼續將要平衡減少團隊工作量的益處和降低過早損失一個優秀應聘者的風險。

設計你要嚮應聘者展示的流程。

大多數面試流程在向高水準應聘者的應用中是失敗的。面試最好的情況是充滿壓力,而最差時單調苦悶。應聘者經常被迫向4個或更多面試官重複他們的故事並不斷回答他們的問題。之後當他們可以問幾個自己的問題時,他們會經常儘量設想自己在公司工作的樣子。接下來他們會為少有真誠的面試結果而等待很長時間。你將如何處理這種支離破碎的狀態。

創造一個你能給予應聘者資料以及能夠反映他們將在你的組織中面對實際挑戰的問題的流程。在此之上,確保你的招聘流程與你團隊的實際動態和文化相符,以使應聘者能夠獲得很多與實際工作相同的體驗。每一位應聘者應該帶著加入你的團隊可獲取的信任感完成整個面試流程。

與你的團隊一起做明智的決定,而不是你單槍匹馬。

不管如何招聘,每一位招聘經理都不得不面對艱難的抉擇。建立對招聘漏斗每一階段應聘者的清晰的評估框架,並依據此自信決策。這包括定義團隊所共識的目標和測量。

同時,與團隊一起開放的決策。這保證招聘經理能夠從參與招聘流程的每一個人那得到對於應聘者的直接反饋。更重要的是,這確保你們在尋求同一質量標準。開放的討論幫助你不斷改進招聘要求和策略。

最後,在評估應聘者時引入跨領域的招聘夥伴。資料科學領域從不是真空中工作。你將與決策者、工程師、產品經理合作。引入這些領域的關鍵招聘夥伴能夠使你所挑選的人才能夠跨越組織各部門。

優秀資料人才的招聘市場競爭激烈,因此你的流程應該確保你能夠快速在招聘漏斗中前行,保持高動能,降低他們接受競爭者offer的機會。快速的招聘需要有流線型的流程設計以確保速度與置信。投資能夠追蹤應聘者在招聘漏斗中每一階段多長時間的工具和後勤設施並快速到位的優化你的招聘系統將會為你贏得競爭優勢。

比市場行動更快

開始“遊戲”

在電影《模仿遊戲》中,Alan Turing的管理技能使英國對德國編碼裝置的反情報破解工作幾近破產。當他意識到他需要幫助時,他已經在Bletchley公園孤立無援。無論如何,千鈞一髮時這個知名電腦科學家的優秀品質幫助他嘗試另闢蹊徑招募新的團隊成員。

為了打造他的團隊,Turing通過釋出在《倫敦每日電訊報》一個猜字遊戲來尋找新的人才,邀請那些12分鐘之內完成該遊戲的應聘者申請神祕職位。成功的應聘者被召集在一個房間裡在可控的環境下限定時間內挑戰他們的數學和問題解決能力。Turing最終給大約30個應聘者其中表現最好的2人發放了offer。

從這個案例中可以學習到很多東西。

這樣的流程確保Turing最大可能的向現有人才廣撒大網,用挑戰性問題和工作機會吸引他們,然後在可控的環境下驗證他們的技能。 影片中的一個虛構環節,Turing招募了一個叫Joan Clarke的女應聘者,她成為了非常緊密的一名合作者。Joan是一個難得的天才,但是如果不是Turing採取了科學的招聘方法,而是存在一定的偏見,Joan幾乎可以確定從密碼破解團隊的角色中被忽略掉。

就像電影《模仿遊戲》,我們將應聘者放進一系列可以模擬他們工作環境以及容易評價他們在聘任後能否勝任工作所具備的問題解決能力的體驗環節。令人驚訝的是,通過正確的規劃和前期投入,這種方法比傳統的面試更加有效率,節省你的團隊時間。

面試流程在高的水準要求下包含兩個關鍵要素:

開放答卷:一種測試應聘者解決一系列逐漸增加難度問題的簡短練習

資料工作日:需要在團隊中針對一個或更多開發性問題工作一整天時間,用一個他們整體的工作報告向面試團隊做總結。

我們將這個流程作為招聘流程漏斗。在500個進入的申請者中,250人(50%)提交了開放答卷,25人(10%)通過了測試,20人(80%)參與了資料工作日,4個人(20%)將會通過測試,最終3個人(75%)接受了offer 。這意味著每發現一名優秀的僱員,我們需要超過150名申請者。

提升的關鍵幾個環境是(A)漏斗中申請者的質量,(B)申請開放答卷和資料工作日的成功率,(C)開放答卷和資料工作日的準確率。通過跟蹤你在漏斗中應聘者以及檢測每個階段的損失率(如:他們從哪裡來),你能確定成績較好和較差的測試環節。

給定我們四個直接目標——準確率(聘任優秀的人才)和成功率(確保他們接受offer)最大化,同時降低損失(應聘者過早放棄)和團隊時間精力損耗(團隊的長期時間精力損耗)——我們投入大量的時間來設計一個資料驅動並且有吸引力的清晰高效的流程。

這個流程包含如下6個階段,從簡單客觀逐漸過渡到複雜主觀:

前期核查:診斷脈搏

開放答卷:測試各項技能

銷售宣傳:確保他們能參加資料工作日

資料工作日:在現實、可控的環境中測試能力並評估文化

決策:進行快速決定性決策

溝通:跟進每一個資料工作日應聘者

讓我們看看每個階段更深入更策略的分析。

前期檢查

值得說明的是,在Sailthru我們不用提前篩查資料應聘者。我們不必核查他們的簡歷或者探討他們的經驗或認證。

如果他們有興趣(並且有email地址),我們給他們開放答卷測試。

這是我們版本的《模仿遊戲》字謎,這節省了大量的時間和精力去更快速服務更有希望的應聘者。

但是不進行核查的最重要的原因是它將會移除大量初始的偏見來源。很多非常有才智的應聘者沒有招聘者所期待的教育和經驗資訊。這不僅僅意味著你將失去優秀的應聘者,同時也讓你更加激進的去尋找少數文案測試表現好的應聘者名單——每一個其他應聘者都想成為名單中的人。

開放答卷

開放答卷是極其重要的。這是過濾應聘者的第一道保障線,因大量的潛在申請從而需要你的團隊大量工作。這也是應聘者第一次能瞭解你的團隊工作的機會。這個階段不僅是一道阻攔在不合適的應聘者上浪費過多時間的屏障,同時也是向匹配角色的應聘者極其重要的宣傳視窗。因此,當你通過招聘漏斗收集了應聘者成績和興趣資料時,你應該不斷的優化該流程步驟。

有效的開放答卷應該具備如下的特徵:

可自我解釋——你想減少應聘者有問題詢問或者需要說明的機會

時間限制——對於有技能的應聘者完成應該花費不超過2個小時

分散脫敏——分佈應該寬泛,不包括任何財產性或敏感性資料

相關性——與你實際工作中面臨的挑戰問題匹配

直接——清晰準確的表明你想通過測試考察的答案,你想怎樣評估應聘者的業績

循序漸進——逐步提升所問問題的難度,以便於簡單的辨認應聘者的實際技能水平。

設計開放答卷測試,首先從你資料團隊中現存的重要問題開始著手。在這些問題中,你可以從(A)擁有或者可以編纂出好的資料,(B)對於應聘者樂於解決,(C)能夠被簡化(大概粗略)成2個小時內被優秀的應聘者解答的問題,中挑出一個或者兩個。

當你收窄了問題的範圍後,編纂開放答卷中問題答案資料。理想情況下,這些資料來源於你的生產環境並足夠清晰,進行過修改或者加工彙總的,以至於當它落入任何人手中也不造成公司損失(假設資料最終將會這樣)。

替代方法是你能構造完全的虛假資料,但是要謹慎對待一些因資料不連續或者異常點引發的很多資料處理難題。我建議提供一百萬行資料(可能涉及多個文件)——足以對程式碼成效引起關注也不至於成為負擔。

一旦你配備了資料,創造2-3個非常清晰的,由易到難依次排列,並且具有確定性可測量答案的問題。確保你的問題不僅能測試應聘者的資料處理能力,同時也能測試他們的邏輯分析能力和模型解釋能力。

給出了配備的資料、選擇的問題和撰寫的指導文件。應該有一份簡短易懂的文件來描述所提供的資料幷包含最終的問題;同時你應該指出應聘者應該用多長時間,不是強加給他們時間限制,而是暗示你評估需用多長時間,以便他們不會花費幾天時間在一個本應該花費幾個小時時間的問題上。

更重要的是,包括一個如何期待應聘者回答問題的部分。你希望他們使用什麼工具?你希望他們提交什麼樣的答案結果?程式碼的質量方面你有何期待?視覺化或者解釋是否對你重要?認真對待這些問題。這是你推薦你和你的組織的關鍵機會。

接下來,讓你其他的團隊成員或者社群朋友們測試開放答卷。通過這些讓你的答卷標準化,確保對你的判斷答案有反饋。你所要做的最後事情是避免給應聘者問題混淆。

最後,建立對所提交答卷的清晰的框架。考慮如下原則:

正確——他們是否得出了最終的正確答案?

符合邏輯——答案的推理是否符合邏輯?

假設——是否做了一些清晰的假設?

程式碼質量——程式碼是否可執行、可測試、有功能分塊、有標註?

有效率——程式碼是否簡潔併合理有效?

技術可用性——他們使用的現代工具或參考是否合適?

溝通——答案是否清晰,呈現是否符合常理?

銷售宣傳

當應聘者通過開放答卷測試,你的下一個挑戰是確認他們能參加你的“資料工作日”面試。多數人會以為在你的辦公室的進行不超過4個小時的傳統面試——當然不會是一整天。讓他們相信值得花費一整天在你這裡是必要的。

銷售宣傳的關鍵部分是你如何與應聘者聯絡,你如何表述你將呈現的令人興奮的機會,你如何描述並準備“資料工作日”。這些應該指向建立他們的興趣和熱情——這不是你評價他們的時候。

每一個應聘者會被不同的因素所激發興趣,因此對於你來講認真傾聽並與他們直接談論他們在意的話題變得尤為關鍵。根據我的經驗,我發現如下的關鍵因素:

產品與公司的總體潛力

資料工作是如何開展的?哪裡報告的?對日後有什麼影響?

不久的未來資料工作的主要挑戰或機會是什麼?

資料工作如何跨部門與其他團隊配合?

所需資料的未來的範圍、大小與質量,未來可收集的機會

團隊如何管理他們的工作並協調不同優先事項與決定。

團隊要用到什麼特定的工具與技術。

最終你會發現那些不願或不能參加“資料工作日”的應聘者。或者這意味著你將失去一些應聘者,但也不得不承擔這個風險。

“資料工作日”會成為你評估所有應聘者的良好標準。

“資料工作日”

“資料工作日”是整個招聘流程的核心部分。它把對應聘者最終的技術、策略和技能評估以及對他/她在工作日中對於團隊和公司的文化體驗的適應性彙集在一起。有了充足的準備,完成這些並不比你的團隊開展傳統面試多需多少時間。

這些準備清單包括:

介紹:言簡意賅的描述工作日挑戰任務、資料和評估原則、應聘者成功所需指導的其他事項等介紹文件。

資料:豐富的被抓取的生產資料可以挑戰並激發你的應聘者。優秀的資料人員應該能不知疲倦的在資料中工作長達一週時間。

膝上型電腦:嶄新效能良好的膝上型電腦將會和他們未來實際工作使用和處理資料所需的預備工具相同。

籌備是成功的資料工作日的關鍵。確保應聘者有激發他們更有產能的環境,可以最大限度地提高他們達成出色工作的時間。

準備介紹:

當應聘者來到他們的“資料工作日”現場,你該做的第一件事是給他們提供一份列印的系列指南。其中的部分包括(儘可能的詳細):

簡介——一封歡迎信和對“資料工作日”的日程及任務介紹

免責宣告(或許是保密協議)——向你的法務部門諮詢是否需要免責宣告

目標——工作任務的總體精要概況和你所期望成功的“資料工作日”應得到的成果

建議的時限——你預期應聘者需要多長的時間。讓他們瞭解自己最大的挑戰是時間的限制。

資料——你所提供的資料的一個寬泛的描述,足以給下面章節的一些背景資訊。

主題——4個或5個精簡的主體列表。

評價——你想從成功的應聘者中得到什麼

技術安裝——膝上型電腦提供的簡要的工具解釋。

資料資訊——

所提供資料的更全面詳盡的描述。每一個文件,作為一個整體的內容描述,每一個包含的領域,和資料集的大小(行或觀測值的數量)。

最重要的事情是選擇研究主題。主題應該儘量差異化以便不同背景的應聘者能夠找到他們自己感興趣同時也是可進行的主題。同時,確保這些主題聚焦在對於你工作有價值的實際應用上。這樣既可以確保你所需要測試的技能,同時也能給應聘者關於你們團隊工作更加真實的感觸。

最後,研究主題應該只是作為建議。我更願意給與應聘者自由發揮的空間。最重要的是在結束時他們能夠對自己所做的有意義的分析和記錄感到自信。

記住,如果你的說明清晰切中要點的話,應聘者將花費更少的時間回答問題。

資料

下一個需要考慮的問題是應聘者所使用的資料。這個資料集將和開放答卷的資料集有兩點不同。第一資料不是廣泛分佈的,因此你應該務必使用生產資料。但是記住當應聘者使用你提供的膝上型電腦時,他們將相網際網路,因此你無法確保完全的控制資料集。因此,確保沒有可確認個人身份的資訊或者重要的戰略性資料在裡面。第二,資料集應該更大更豐富。可以包括更多觀測值,更多的資料集,更復雜的時間序列和每個觀測值更分散的資料點。資料工作日的一個重要的挑戰是需要應聘者執行“真實世界”的資料並且進行實證分析或者模型選擇。這通常需要忽略大量的現存的資料或者通過過濾或者歸併來顯著簡化資料。

最後,你會因優秀的應聘者使用你所提供的條件進行的創造而驚歎不已。

你需要提前多少來預處理資料是一個重要的因素。總體而言,除非你特別想測試他們清洗繁雜資料的能力,我建議保持樣本資料足夠乾淨以確保他們不會把本該用於分析或者建模的時間浪費在資料清洗上。

膝上型電腦

嚮應聘者提供一臺在可查詢的路徑下預裝了說明、資料和軟體的膝上型電腦。在Sailthru公司,我們使用蘋果的MacBook Pro(所有的資料科學家和工程師使用Mac或者Linux工作),我們安裝瞭如下軟體:

HomeBrew

Anaconda (Python distribution)

R

RStudio

Emacs and Vim

Java 7

Eclipse

在HomeBrew的幫助下,資料人員能很快安裝其他需要的軟體。同時,我們把.CSV的資料文件放進他們的根目錄下。我們建議應聘者使用開源的編輯語言(如Python,R或者Julia)提交他們的開放問卷以便每個人都習慣使用它。

時間表:

在Sailthru公司一個典型的資料工作日是這樣的:

上午10:00—簽到

應聘者簽到,受到我們招聘團隊的歡迎,並參觀指定地點

上午10:05—拍檔

應聘者的拍檔(指定的資料科學團隊成員)帶應聘者喝咖啡並帶他/她參觀辦公室。

上午10:15—培訓

資料工作日拍檔給候選用筆記本和簡要說明嚮應聘者在哪裡可以找到資料

上午10:20—指導

應聘者坐下來閱讀行動指南檢查資料,並決定選擇一個研究方向

上午11:30—籌備會

應聘者認真聽取團隊籌備會,瞭解他或她的工作內容,並陳述他或她的研究方向是什麼。

上午12:30—午飯

一些拍檔帶著應聘者去吃飯,過程中瞭解更多關於他/她的背景和性格,並讓應聘者問一些問題。

如果需要問問題:

應聘者可能會問團隊中任何成員資料、技術或背景相關的問題,但往往從他們的拍檔開始(如果可行的話)。

下午4:30—提醒

我們提醒應聘者,他/她將在5:30提交結果,並鼓勵他們開始準備他們的演示。

下午5:30—結果呈現

應聘者用20分鐘呈現他/她一天中所發現的內容,然後是10分鐘的團隊及其他與會者的問答環節。

下午6:00—反饋

我們要求應聘者給我們對他/她的體驗反饋,然後搭檔或招聘人員引導應聘者暫時離開並約定期望溝通最終結果的時間。

下午6:15—決策

招聘團隊完成他們對於應聘者的討論,90%的決定將會產生。

總體而言,從招聘團隊給出的時限是很合理的。拍檔在早上花15分鐘時間,也許下午再花15分鐘回答應聘者問題。籌備會和午餐會不可精簡。演講和問答一組五人需30分鐘,然後通常再需要15分鐘做決策。總的來說,團隊花費超過4人小時和應聘者在一起,不會比花在傳統面試上的實際多。

到目前為止,從文化匹配視角看當天最深刻的部分應該是午餐時間,你可以看到應聘者在一個非正式的社會場合的行為表現。從技術角度來看,這一天最深刻的部分是成果呈現後的問答環節,我們為了驗證應聘者方法的嚴謹性並確定他們如何應對我們的團隊中很常見的激烈的技術或分析辯論,會想盡辦法去提出探索性和挑戰性問題。

課程收穫:

資料工作日應該是你的團隊和公司工作的一個折射,因此你應該使這個流程環節適合你的特定工作需要。我們強調在日程結束時收集應聘者的反饋,並且根據他們所提供的資訊進行若干次的優化調整。這裡有一些很好的經驗:

應聘者多數會感覺時間不夠用。鼓勵他們選擇一個自己有信心的方向並且通過迭代的方式完成工作。這樣,如果他們的方法不能良好工作,他們仍有充足的時間去修正。同時,強調進行結論性分析比定義性分析呈現的效果更好。

不要讓午飯時間太長。應聘者只有有限的時間工作,45分鐘後應該儘快返回以確保及時完成工作。

廣泛的邀請各類群體參與結果呈現。任何你能想到與應聘者有穩定聯絡的熟人都應該可以。這給你更多的機會了解他們對於應聘者個人的工作和溝通方式的反饋,給你的應聘者一個更好的人際關係感知。

在應聘者到來之前給予他們開放資料工作日的相關資訊。這樣他們會有時間對這段體驗做精神準備,減輕當天的壓力。

5. 決策

我們在Sailthru公司基於如下的維度評估應聘者。

a.問題分析結構

如何進行問題的解構分析,有什麼假設條件,如何限定研究範圍?

b.技術嚴謹性

你所程式碼編寫的程式碼在完成任務方面可靠性、可讀性和靈活性如何?方法的可擴充套件性如何?

c. 分析的嚴謹性

你所運用的方法(機器學習,統計,分析,視覺化)的邏輯是否通順完整有意義?

d. 可溝通

你將如何清除的表述你的工作,方法和結論?你問他的答案有效性怎樣?

e. 有用性

如果生產過程有意義,在Sailthru這些結果在你的工作中是否有用?

我們在資料工作日包括了這些指導原則,應聘者知道後就更容易成功。

在應聘者完成他們的演講和問答後,他們的拍檔出現在辦公室。然後我們立即開始討論應聘者,儘管大家的印象都是陌生的。我們給每位參與者一個機會來分享對上述標準的反饋(如果他們有意見),從我們團隊以外的人先開始。我們團隊成員中經驗最少的人先說,最有經驗後說。這會有助於事先防止房間裡其他人的意見受團隊或領導人的偏見影響。

一般來說,如果任何面試官對應聘者是一種強烈的“拒絕”態度時,這是足夠的理由來拒絕應聘者。

因為技術原因(開放答卷應使大多數考生完全符合產出要求)這種情況很少發生。但當它發生時,你應該認真地重新評估你的測試以確保它的有效篩選應聘者。

因為文化的適應或溝通的原因當該情況發生時,公開的討論該問題是非常關鍵的。這有助於建立和加強你的團隊想要呈現的健康標準,並減少了屈從於個別人偏見的風險。

如果每個人都對應聘者不冷不熱,這也是一個明顯的“拒絕”。這通常是因為侷限於他們的工作限制——他們工作完成情況,他們思維的嚴謹性,或他們的技術實施情況。如果僵局存在,那麼要麼團隊的領導者應該做出最後的決定(判定是否是錯誤的拒絕),或者在更少數情況下,你可能需要邀請應聘者回去進一步討論。

6. 溝通

這個流程的最後階段是嚮應聘者溝通結果。那些開放答卷測試中失利的人從會我們的招聘者那裡獲知資訊。我們都希望給每位申請者直接的反饋,但鑑於申請者的數量規模不甚可行。

可以說,資料團隊的成員被參加資料工作日後沒有收到offer的每一位應聘者跟隨著。這確保這些應聘者收到建設性的反饋從而可以從經驗中學習更多。

最終,我們因每天大量的資料工作日應聘者而感到興奮,同時也要尊重他們的時間並保持聯絡的情況下以期我們會再見。資料科學領域是一個小社群。

在加入Sailthru公司前,Jeremy Stanley擔任為安永服務的全球市場分析採集和指導領域技術長。

挑戰與未來的機遇

招聘優秀的資料科學家是很難的事情,而我相信,這個流程在Sailthru公司的招聘中已經產生了非常積極的影響,我也相信我們有更多需要學習的地方。這就是我們繼續拼搏的意義。

使錯誤最小化

我們的招聘流程中可能會產生太多的錯誤,即非常適合資料科學工作的應聘者沒有收到offer。最大的錯誤來源可能發生在開放答卷階段,考生可能不願意花時間來完成測試。對優秀人才來講使測試更容易完成並提高我們在社群組織的品牌都是我們可以採取的步驟。最終,這是一個通道的優化問題,問題的根源是它會降低你能招聘到最優秀的人才的能力。

淘汰那些在資料工作日積極拼搏的優秀應聘者遠不是我們的初衷,這些應聘者投資了我們,而我們已經投資了他們。發生這種情況有幾個原因,但最常見的是資料工作日是一個高壓力的環境。應聘者必須在短短的8個小時內瞭解一個新的資料集,謀劃解題框架,制定解決方案和進行結果呈現。

有些應聘者在這種壓力下脫穎而出,而另一些被迫屈從,並不能向我們證明他們通常能夠做到的。不幸的是,我們無法在我們的決策中考慮這一點,因為這無法將其與無能或低效區分開來,兩者都是我們積極反對的。

應聘者在資料工作日不能勝出的另一個原因是他們不熟悉工具。他們可能對專有的或商業的工具或者另一個作業系統有更多的經驗。這可以通過提供更多的商業軟體許可證和在虛擬機器上提供Windows使用來緩解問題。這些選項會花銷大量現金和運營成本。同時,對Linux操作環境和開源工具是我們強烈認為必須的。

開始運轉

可以說這一流程中最具挑戰性是讓它開始運轉起來。如果他們沒有一個穩固的且已到位的團隊,可以適應、執行和優化這個流程的話,許多組織將為此努力不已。

此外,本系統需要資料科學團隊和招聘團隊之間的協作,都需要相信這是值得投資的不斷演化過程,亦或是無法實現和無法長期持續的過程。

為了其他部門完善流程

在Sailthru公司,我們正在為了積極適用其他部門(如軟體開發部門)而努力重塑這個流程。流程結構可以保持大致相同而面對的具體挑戰可能不同。

例如對於開發者來說,你可以提供一個明確的GitHub報告,要求他們開發一個具備明確要求和驗收標準的簡單應用。這提供了不僅可以看到他們如何構建和編碼應用程式,同時看到如何優化軟體(例如測試驅動型優化)以及他們如何實施檔案的機會。

或者你可以把你現有的應用程式的其中一部分抽取出來,簡化到容易被開發者執行的程度,刪除其中特定的屬性,然後要求他們重新編碼。這可以讓你看到他們在你現有的程式碼上做了什麼,同時你已經有了一個明確的基準來判定這些屬性該怎樣實施。

文章主旨

這個招聘流程已經在我領導的資料科學團隊中起到了真正革命性的作用。我們讓那些在筆試和麵試中優秀的應聘者通過,但尚無法使化開放式資料問題結構化或防止他們的其他分析方法選擇。

我們已經錄用的那些之前我們從不可能錄用的應聘者。

例如,在過去我會篩選出幾乎沒有幾年前的工作經驗的任何應聘者,擔心他們會太學究。但是使用這個工作流程,我們僱了一個充其量是個數量專業博士和有一點點實習經驗的資料人才,因為他在資料工作日表現出傑出的實踐工作技能。他已經能在他到來的前兩週開始改進生產並且在前三個月帶來巨大的積極影響。

然而,這個流程中我最重視是它消除了我們決策中大量的疑問和不確定。招聘是我們作為管理者一個最重要的決策,有明確的證據來支撐你的信心是件很美妙的事。

當我們發現一個很有前途的應聘者,我們會很快知道我們可以把我們的組織和團隊銷售給應聘者,並註定在激烈競爭的招聘市場中能夠獲勝。作為一個額外的好處,我們可以不用像每個人都認同的那樣總是通過書面測試勝出來選拔人才。

投入的時間和精力把你已經現有的流程優化成能夠迅捷反應並確定挑選出在你真實的挑戰和機遇中勝出的應聘者。

最後不要再擔心招聘優秀的科學人才了。

(via:網際網路)