聯合利華、高盛等 100 多家公司都在用 AI 面試官,靠譜嗎?

力琴發表於2019-10-28

聯合利華、高盛等 100 多家公司都在用 AI 面試官,靠譜嗎?

分析超過 100 萬個應聘者,普遍應用於酒店和金融業。

編譯 | 力琴

你是否體驗過 AI 面試?

一個人對著手機或者電腦,根據螢幕上提示的問題進行作答,回答所有問題後,AI 會告訴你是否勝任這份工作。

這是一項基於人臉識別的視訊面試方案,通過分析應聘者在視訊面試中展現的面部活動、措辭和語調,進行建模和預測,並協同排名演算法,確定哪些候選人最接近理想人選。


聯合利華、高盛等 100 多家公司都在用 AI 面試官,靠譜嗎?



招聘技術公司 HireVue 設計了名為「AI-driven assessments」的評估系統,希爾頓、聯合利華、高盛等在內的 100 多家公司都在使用。這意味著,用人工智慧篩選應聘者會成為人才招聘的未來走向。這項技術已經普遍應用於酒店和金融業,已經分析超過 100 萬個應聘者。

人臉識別篩選求職者的市場需求會有多大?又會有哪些爭議?

1 偽科學 or 客觀依據

一些人工智慧研究人員認為,這個系統只是靠簡單演算法得出的結論,缺乏科學依據。他們認為,這會對非母語人士,明顯緊張或不善言辭的應聘者不利。

紐約研究中心 AI Now Institute 的聯合創始人梅雷迪思•惠特克(Meredith Whittaker)說:「這項研究令人深感不安,我們擁有專有技術,聲稱可以根據面部運動、語調、行為習慣來區分合格員工和不合格員工。」

「這是偽科學,被視為一種歧視。」她補充說。「被這些制度左右的人沒有任何機會參與進來。」

HireVue 的技術長洛倫·拉森(Loren Larsen)表示,這種批評缺乏依據,大多數人工智慧研究人員對員工思考和行為背後的心理了解有限。

拉森表示,與招聘人員主觀衡量標準相比,這個體系更客觀。在他看來,招聘人員的思維是「終極黑匣子」。

他向《華盛頓郵報》表示:「人們總是因為他們的容貌、鞋子、穿著被拒絕。演算法消除了大多數客觀性因素。」

他表示,人工智慧不會解釋自己的決定,也不會給考生打分,他稱這些分數「無關緊要」。如果一些人被淘汰就會認為系統是不合邏輯的。

「當 1000 人申請一份工作時,999 人會被拒絕,不管公司是否使用人工智慧。」

難以理解的演算法迫使求職者面對一種新的面試焦慮。

康涅狄格大學(University of Connecticut)數學和經濟學專業的高年級學生尼科萊特•瓦圖利(Nicolette Vartuli)的平均成績為 3.5 分,她研究了 HireVue,並盡了最大努力讓求職面試機器眼花繚亂。她在規定的時間內自信作答,使用了積極的關鍵詞,並且還很開心地笑。

但她沒有拿到 offer。她看不到電腦對她的評價,也不知道她該如何改進,是她看起來不夠友好嗎?她說話太大聲了嗎?人工智慧招聘系統認為她做錯了什麼?

「我可能說得太自然了,」瓦圖利說,「也許我沒有使用花哨的詞語。我曾經用過『聯合企業』這個詞。」

HireVue 表示,該公司的系統分析了求職者反應的最細微細節——他們的面部表情、眼神交流和感受到的「熱情」——並編制了公司可以用來決定聘用或不聘用誰的報告。

求職者不會被告知他們的分數,也不會被告知他們做錯了什麼,他們也不能問機器,他們是否能做得更好。人力招聘經理可以使用 HireVue 分數以外的其他因素來決定。

2 成為流行

擁有大量入門級職位空缺的大型僱主正越來越多地求助於這類自動化系統,以幫助尋找候選人、評估簡歷和提高招聘效率。

例如,矽谷初創企業 AllyO 推出了一款「招聘自動化機器人」,它可以向求職者傳送諸如「你願意調動工作嗎」之類的簡訊。

HireVue 的競爭對手、「數字招聘」VCV 也提供類似的電話面試系統,在電話面試中,求職者的聲音和答案由「自動篩選機」進行分析。

HireVue 公司表示,它可以為僱主節省大量的面談時間,並迅速淘汰那些被認為不合格的應聘者。它還允許公司從一個更大的招聘池中看到候選人:任何有電話和網際網路連線的人都可以申請。

HireVue 的首席行業組織心理學家內森·蒙德拉貢 (Nathan Mondragon) 告訴《華盛頓郵報》,標準的 30 分鐘 HireVue 評估包括 6 個問題,但最多可以得出 50 萬個資料點,所有這些資料點都會成為個人計算得分的組成部分。

僱主決定書面問題,然後 HireVue 的系統會記錄和分析他們的回答,同時向候選人顯示。AI 會評估人臉的移動方式,例如確定某人對某項工作任務的興奮程度或他們如何在生氣顧客面前的表現。蒙德拉貢說,那些「面部行動單元」可以佔一個人分數的 29%,他們說的話和聲音的「音訊特徵」(如語氣)構成了其餘部分。

拉森說,為尋找內容訓練系統並針對特定工作量身定製測試,僱主目前在從事同一工作的員工都要接受 AI 評估。他們的回答將與這些應聘者過去的工作表現相聯絡,例如他們達到銷售配額的程度以及解決客戶電話的速度。

3 擴張計劃

HireVue 於 2014 年推出了 AI 評估服務,作為其視訊採訪軟體,全球 700 多家公司已經使用了近 1200 萬次。

該公司上個月表示,私募股權巨頭凱雷投資集團(Carlyle Group)將成為其新的多數股權投資者,將從 185 億美元的基金中提供一筆未披露的金額。這家投資公司的執行董事帕特里克·麥卡特(Patrick McCarter)內部使用了 HireVue 的視訊採訪。

在酒店業巨頭希爾頓國際集團(Hilton International),成千上萬的管理和呼叫中心職位的申請人已經通過 HireVue 的 AI 系統進行了稽核。

該公司全球招聘副總裁莎拉·斯瑪特(Sarah Smart)表示,該系統已從根本上重新繪製了希爾頓的招聘儀式,使該公司能夠以閃電般的速度吸引應聘者。現在,被申請者淹沒的招聘經理只能看看誰在該系統中排名很高,然後過濾掉其餘的人。「招聘人員很少超出這個範圍。」

在消費品聯合企業聯合利華(Unilever)裡,HireVue 可以幫助節省 100,000 個小時的面試時間和每年約 100 萬美元的招聘成本。

HireVue 客戶高盛的全球人力資源管理主管 Dane E. Holmes 在今年春天的《哈佛商業評論》中寫道,這家銀行業巨人大約 50,000 個視訊採訪記錄是「資料寶庫可幫助我們進行有洞察力的研究分析」。

他說,這些資料將幫助公司弄清楚應聘者的技能和背景如何與他們的工作表現或在公司工作多長時間相對應。他補充說,該公司還在「使用簡歷閱讀演算法進行實驗」,這將有助於確定新員工的部門和任務。

HireVue 的擴張也幫助它從 Re:work 等規模較小的組織手中贏得了業務。

Re:work 是芝加哥的一個非盈利組織,為當地失業的求職者提供技術培訓。該組織負責人謝爾頓班克斯 (Shelton Banks) 表示,事實證明,在評估哪些候選人值得付出努力方面,HireVue 是一個不可替代的嚮導。

這個非營利性組織曾經允許幾乎所有人參加它為期八週的強化訓練專案,但很多人早早就筋疲力盡了。現在,每位候選人都要先通過人工智慧評估,對他們在解決問題和談判技巧方面進行排名,並幫助團隊確定誰最有動力、好奇心和勇氣。

班克斯說:「當涉及到這個人的生活時,知道這個人的起點在哪裡,可以幫助我們更準確地對哪些人說『是』或『不是』。」

4 技術爭議

研究情感的神經科學家麗莎·費爾德曼·巴雷特(Lisa Feldman Barrett)表示對該系統存疑。她最近領導了一個由四名資深科學家組成的小組,其中包括「計算機視覺」系統的專家,評估了 1000 多篇已發表的研究論文,研究人臉識別是否能表達人的情感以及背後演算法對人的理解程度有多深。

他們發現,該系統在檢測面部運動方面已經變得非常敏銳,發現了微笑和皺眉之間的區別。但是,他們仍然擔憂系統不瞭解這些運動背後的真正含義。對於人們如何表現出情感或個性方面的巨大文化和社會差異,他們還沒有做好充分的準備。

比如皺著眉頭,會被容易理解為生氣,這對尋求銷售助理工作的人來說是一個危險訊號。但是人們皺著眉頭也可以表達很多含義,比如當他們集中精力的時候會皺眉頭,感到困惑的時候也會皺眉頭。」

微軟位於蒙特利爾研究實驗室的研究人員盧克·史塔克(Luke Stark)以個人而不是微軟員工的身份對情感和 AI 進行了類似的研究。他質疑,HireVue 是否能夠根據他們的語調和片語變化來預測員工的個性。

他表示,像 HireVue 這樣的系統,即使在沒有科學支援的情況下,也呈現看似令人信服的資料點。而且他發現這種「數字魅力」確實令人不安,因為僱主在尋求決定申請者職業道路時可能會過度自信。

他說,當今最好的人工智慧系統極易產生誤解和意圖。即便是他們預測一個人在真實價值方面的成功,也可能有助於延續一種「同質」的企業單一文化,即每一個新員工都效仿上一個。

HireVue 的拉森表示,該公司利用「世界級的偏見測試」技術,對其業績資料進行審計,以尋找可能存在歧視性的招聘做法,即所謂的負面影響。他補充說,該公司的演算法已經使用最深入、最多樣化的面部動作單後設資料集進行了訓練,其中包括來自許多國家和文化的人。

但是,HireVue 的發展遇到了一些監管障礙。今年 8 月,伊利諾伊州州長 j·b·普里茨克 (J.B. Pritzker, D) 簽署了一項全國首個強制僱主告知求職者其人工智慧招聘系統如何運作的法律,並在通過測試前徵得他們的同意。HireVue 表示支援這項措施,將於明年 1 月 1 日生效。

州眾議員、該法案的共同提案人、民主黨眾議員小安德拉德 (Jaime Andrade Jr.) 說,在得知有多少求職者在求職面試的人工智慧階段被拒後,他推動了這項透明法律。他擔心,口音或文化差異可能會不恰當地扭曲結果,而那些拒絕參加評估的人可能會因為沒有被考慮而受到不公平的對待。

但一些 HireVue 的受訪者質疑,根據半小時的網路攝像頭來判斷一個人的工作表現或個人能力是否公平,甚至是否明智。他們還擔心,人們對考試的緊張情緒可能最終會讓他們徹底喪失考試資格。

芝加哥大學 (University of Chicago) 大三學生凱瑟琳·李 (Katherine Li) 參加高盛 (Goldman Sachs) 投資銀行實習生的面試。但她還是覺得整個過程有點令人不安。

她說:「奇怪的地方在於,你並沒有真正理解你需要做什麼才能給演算法留下深刻印象。」「只有你和一臺電腦,沒有關於你做的是對還是錯的反饋。」

芝加哥大學大三學生凱瑟琳·李(Katherine Li)在 HireVue 接受了高盛投資銀行實習的採訪時說,她建立了一個潛在提示問題庫,並在鏡子中練習答案,以確保她看起來「理智」。仍然發現整個過程有點令人不安。

杜克大學(duke university)經濟學教授埃瑪•拉西爾(emma rasiel)經常為在華爾街求職的學生提供諮詢,她說,她看到越來越多的學生對即將到來的 hirevue 考試感到過度不安。

大學經濟系現在在學生資源網站上提供了一個招聘面試指南,包括一些典型的問題(「誠信對你意味著什麼?)和行為技巧(「表現自然,慢慢說!」)。

Rasiel 說:「我們有一個焦慮的一代,現在我們要他們與計算機螢幕交談,向相機回答問題……但沒有關於如何使自己變得更好或更糟的真正指導。」

神祕的要求也可能使人們的焦慮過度。皇后區 25 歲的謝赫艾哈邁德 (Sheikh Ahmed) 在申請紐約周邊銀行的出納員工作時,他說他收到了八份 HireVue 評估工作,都安排在同一天。

他研究瞭如何說話和行動的指南,但發現最難的部分是弄清楚攝像機的角度:太高,他擔心,他會看起來很霸道;如果太低,他會顯得萎縮和虛弱。

在開始馬拉松式的人工智慧採訪之前,他穿上一件乾淨的襯衫、一條領帶和一條睡衣褲,去了他爸爸的隔音音樂工作室,遠離了家裡嘰嘰喳喳的聲音。他還關掉了空調,希望背景噪音不會影響他的分數。

他在每次採訪中都會稍微修改一下答案,希望演算法能找到自己喜歡的答案。但他發現,把自己的生活經歷和價值濃縮成一個對電腦友好的聲音片段,既令人疲憊,又令人沮喪。

到最後,他的嘴都幹了,全身都是汗,他還懷疑自己有沒有跟系統進行足夠的眼神交流。面試幾周後,他仍在等待工作機會。

相關文章