技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

機器之心發表於2020-06-02

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

在就業市場上,有一個永恆的定律:招聘者感覺很難找到合適的人才,同時求職者感覺很難找到符合期望的工作機會。造成這種現象的原因之一就是資訊不對稱問題。

隨著人工智慧近年來的飛速發展,這一技術正在成為招聘和求職過程中的新工具,一方面開始接管 HR 工作中簡單重複的部分,幫助企業提升招聘的效率和智慧化程度;另一方面幫助求職者從成千上萬的職位中篩選出最適合自己的機會,從而更好地去規劃職業發展路徑。

目前,這方面的技術已經在各類招聘及職業社交平臺上廣泛應用,使得招聘與求職雙方的使用者體驗都得到了極大的提升。

作為全球最大的職場社交網路,領英(LinkedIn)目前的使用者總量已經達到 6.9 億以上,在中國擁有超過 5000 萬名使用者。對於領英來說,人工智慧技術是如何融入面向眾多招聘者和求職者的日常服務的

招聘者與求職者,AI 牽線搭橋

我們先來了解一下人工智慧在求職招聘領域的應用情況。

一般來說,人工智慧在尋找候選人、篩選和培養候選人時最有幫助。對於招聘流程中更加複雜的部分,例如與候選人者積極溝通和麵試候選人,人工智慧能夠幫助到的地方相對少一些。同時,人工智慧技術的應用也可以彌補人工招聘工作中的諸多不足,比如篩選速度、主觀成見、人才分析等。

根據領英發布的 2018 招聘趨勢報告顯示,在接受調查的專業人才和招聘人員中,67% 表示人工智慧有助於節省時間,43% 表示人工智慧有助於消除偏見,31% 表示人工智慧在尋找最佳候選人方面很有助益。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

人工智慧技術能起到作用的招聘環節。

面向招聘者,領英提供了多種「人才搜尋與推薦」方面的產品。

比如 LinkedIn Recruiter,它會根據使用者的反饋,更主動、有針對性地為招聘的職位推薦候選人。傳統的搜尋和推薦系統一般只關注搜尋內容和查詢關鍵詞的相關性,但這裡的人才搜尋功能還需要滿足一點,就是招聘人員和候選人在相關領域互相對彼此感興趣。經過此類篩選後,不僅應聘者需要與招聘者的工作需求相契合,並且招聘者聯絡的求職者也必定對崗位機會感興趣,從而提高雙方的匹配成功率。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

LinkedIn Recruiter 產品截圖(模擬)。

面向求職者的「職位推薦」也是領英的主打產品之一。使用者在領英上傳個人簡歷,平臺會推薦適合求職者的工作。目前很多求職招聘平臺都會提供這種功能,但如何做出精準高效的個性化推薦,至關重要。

領英做的第一步是建立知識圖譜和研發針對自然語言的標準化技術,並針對每位使用者的簡歷,使用基於深度學習模型的標準化技術來實現資訊抓取,比如 LSTM、CNN 等等。為了實現個性化服務,領英採用了能夠從多角度理解內容的機器學習演算法,透過將機器學習與會員意圖訊號、檔案資料和會員人脈網路資訊結合起來,實現會員推薦和搜尋結果的高度個性化。

此外,為了提升應聘者和企業的使用感受和招聘效率,在候選人溝通和麵試方面,領英也提供了兩種新功能:

一是旨在提升應聘者面試表現的「Interview Prep」,它會提供人工智慧即時答案反饋的功能。這項功能可以根據求職者以往有記錄的回答,為他們提供其中一些比較常見面試問題的即時反饋。 

二是旨在提升企業對應聘者軟實力考察效率的「影片介紹功能」,它能幫助招聘者邀請應聘者,透過以短影片或者筆試的形式回答 1-2 個問題,去展示應聘者的交流技能和其他軟技能。這個功能目前處於測試階段。

據統計,自從「可能感興趣職位」的個性化人工智慧服務上線後,職位申請數量增長了 30%。在領英中國團隊將該模型在中國使用者後,職位申請的數量又額外提高了 11%。在人工智慧驅動的產品最佳化之後,職位申請量實現了 40% 的年度增長。透過利用人工智慧改進的招聘解決方案,站內信回覆率提高了 45%,同時也減少了領英向會員傳送通知的數量。

解密技術細節

在這些面對 6 億多使用者的人工智慧服務背後,領英是在利用哪些技術作為支撐?

線上學習演算法(Online learning)

領英用來訓練演算法的技術稱為「Online Learning」,這也是一種在工業界應用十分廣泛的機器學習演算法。

基於招聘者與候選人的互動方式,領英的演算法會在招聘過程中持續學習招聘者的偏好,並提供與需求更加貼合的候選人。這種線上學習驅動的推薦系統利用工作描述、招聘者接觸過的或存檔的候選人,以及對這份工作感興趣的求職者等多維資訊,綜合計算,主要應用於為公開招聘職位匹配最佳候選人

舉個例子,如果招聘者一直對「具有領導技能的會計師」或「擅長社交媒體的專案經理」等類別的候選人感興趣,領英就會推薦更多類似的候選人,潛移默化地學習和推測對招聘者當前人才需求和意圖。所有過程實時在網路上計算進行,求職市場的反饋變化一旦發生,就會被立即學習。

在新功能 Recommended Matches 中,領英基於使用者的隱身求職狀態(Open Candidate)和其他潛在的求職指標(例如,技能、頭銜、行業和資歷),在系統中按照競爭力的強弱展示出這些求職者。領英的演算法會根據候選人是否符合求職標準、是否表現出求職意向以及是否對招聘者的工作感興趣,計算出最有可能接受工作的候選人。

代表性結果(Representative result)

當然,在候選人篩查方面還存在一個「公平問題」。由機器學習模型計算出的求職者排序可能無意中產生偏見,進一步減少弱勢群體的競爭力。

在領英看來,合格的候選人和人才搜尋功能中排名靠前的候選人,他們對工作的興趣的型別分佈應該大致相同。這意味著,在搜尋中排名靠前的人才在更廣泛多樣化的能力層面上需要更具“代表性”(Representative)。

因此,領英採取了具有代表性的人才搜尋系統的技術架構,透過機器學習模型檢索的候選集進行重新排序,向招聘人員展示一組與工作需求相符合的潛在候選人,以確保減輕偏見,獲得多樣化的人才。

人才搜尋與推薦系統底層架構設計

對於招聘方來說,人才搜尋與推薦系統的設計非常重要。領英在 Lucene 上建立了一個名為 Galene 的搜尋堆疊,並搭建了各種外掛,包括實時更新搜尋索引的功能。搜尋索引由兩種型別的欄位組成:

  • 反向欄位:從搜尋詞到包含搜尋詞的實體 (領英使用者) 列表的對映。

  • 正向欄位:從實體 (領英使用者) 到關於它們的後設資料的對映。

這些搜尋索引欄位有助於在搜尋排名中評估機器學習的特徵價值(Feature Values)。搜尋索引欄位中資料的新鮮度(Freshness)對於機器學習特徵也非常重要。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

人才搜尋架構和流程。

Recruiter Search 功能中有一個分層的排名架構:

  • L1:挖掘人才庫並對候選人進行評分 / 排名。候選人的檢索和排名在這一層是以分散式方式進行的。

  • L2:透過使用外部快取最佳化入圍人才,以適應更多動態特性。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

檢索和排名架構。

Galene Broker 系統將搜尋查詢請求分發給多個搜尋索引分割槽。每個分割槽檢索匹配的文件,並將機器學習模型應用於檢索到的候選人。每個分割槽(即單一的能力指標)對候選人的子集進行排序,然後代理系統收集排序後的候選人,並將它們返回給 Search Federator,這是 L1 層架構。在 L2 層,Search Federator 會進一步根據額外的動態或從快取資訊中引用的排名特徵,對檢索到的候選人進行排名。

但如何根據招聘人員所尋找應聘者的型別,來模擬其意圖和偏好,一直是人工智慧在招聘領域應用中的挑戰。此前,領英嘗試過兩種方法:透過領英所儲存的招聘人員使用資料,進行離線學習個性化模型來實現;或者透過收集了解招聘人員線上使用時的偏好來實現。

離線學習模型的一個不足是,招聘人員線上實時檢查推薦的候選人並提供反饋時,其最新偏好和意圖不能在正在進行的搜尋會話中得到實時的反應和反饋。因此,LinkedIn Recruiter 團隊根據使用者反饋建立了更加貼合需求的系統,並根據各種條件(如,每一次應聘中給候選人提供的即時反饋)進行多步驟運算後,推薦該職位的最佳候選人。

下面是領英用於這種系統的架構,它首先將潛在的候選人按照技能分成幾組。然後,基於招聘人員的當前意圖,利用 Multi-Armed Bandit 模型來分析出哪個組別更理想的適應工作需求,並且基於招聘者的反饋來更新每個技能組內的候選人排名。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

Multi-Armed Bandit 線上個性化系統的架構。

下面是領英對這種推薦演算法的初步實驗的一些結果。圖表顯示,隨著更多的反饋被結合新增到推薦模型中,推薦候選人的質量得到了最佳化提高,領英也得到了越來越多的正面反饋。

技術秘笈:領英6.9億使用者背後,AI如何為招聘者與求職者牽線搭橋?

匹配到良好的候選人的百分比。

職位推薦系統

最後需要介紹一下「職位推薦」背後的技術。這種方式在當前的招聘領域是很常見的,使用者們也會發現如今收到的職位推薦精準度已經到達了一個比較高的水平。這種從「線性推薦」到「深度個性化」的變化背後,經歷了技術的多番改進。

此前,領英的職位推薦是一個線性模型,也就是說,如果求職者是一個軟體工程師,領英就會推薦一個軟體工程師的職位。但這種推薦模式的不足也很明顯,在職業種類和領域交叉越來越豐富的今天,對於很多使用者來說並不太個性化。

為了實現「深度的個性化」,領英研發了 Generalized Linear Mixed Model(GLMix),針對每個使用者和每個職位建立一個單獨為他們服務的模型,根據使用者之前的職位申請,為他推薦更多類似的職位,這使得領英模型的引數量達到了上百億的規模。後來,領英建立了一個 Deep&Wide 的模型,整合了深度學習、樹狀結構模型以及 GLMix,實現了比較好的模型效果和使用者體驗。

為了實時更新上百億的模型引數以及在毫秒級別內滿足使用者的職位推薦需求,領英搭建了大規模運算平臺來實現人工智慧模型的技術。這個平臺包括線下和線上兩個模組:線下模組自動收集使用者的反饋、基於 Spark 自動訓練,之後把模型結果和引數上傳到線上。線上上,領英使用自己的實時資料傳輸和搜尋引擎技術來實現低延遲的模型運算。

本文根據領英工程師部落格內容整理。

參考連結:

https://engineering.linkedin.com/blog/2019/02/learning-hiring-preferences--the-ai-behind-linkedin-jobs

https://engineering.linkedin.com/blog/2018/10/building-representative-talent-search-at-linkedin

https://engineering.linkedin.com/blog/2019/04/ai-behind-linkedin-recruiter-search-and-recommendation-systems

https://www.linkedin.com/pulse/人工智慧在大規模招聘求職上的應用-liang-zhang/ 

相關文章