人崗智慧匹配,基於記憶的深度文本匹配技術

  • 2019 年 10 月 28 日
  • 筆記

針對互聯網求職招聘場景的人崗匹配推薦問題,本文提出了一種建模求職者與招聘者雙方偏好的新型深度文本匹配模型。該模型通過引入記憶模組,利用簡歷文檔和崗位描述文檔之間的資訊交互來學習潛在偏好表示,並將偏好結合到匹配框架中構建端到端的深度神經網路模型。 基於在線招聘平台 Boss 直聘數據集的實驗結果表明,本文提出的模型效果超過 state-of-the-art 的人崗匹配推薦方法,各評價指標均有顯著提升。實驗證明,互聯網招聘場景中的求職者與招聘者雙方確實存在歷史行為偏好,並且該偏好可以用來改善人崗匹配推薦系統。目前,該論文已被數據挖掘領域高峰會 KDD2019 接收。

論文下載地址

https://pan.baidu.com/s/1mbTWIPAzUIXkIU-2cIiWEw

背景介紹

在線招聘服務的產生與發展不斷衝擊著就業市場上的傳統招聘模式。如今,互聯網上存在著數億規模的求職者簡歷以及崗位招聘資訊。如此大規模的數據給互聯網招聘帶來了新的挑戰:如何能夠自動並準確地將合適的崗位描述文檔與簡歷文檔相匹配,以便高效地將合適的人才配置到與之相應的崗位上。因此,學習並構建完善的人崗自動匹配推薦系統顯得十分重要,這既有助於招聘人員找到合適的候選人,也有助於求職者能夠找到合適的崗位。現有針對人崗匹配推薦問題的研究通常集中在學習簡歷文檔以及崗位描述文檔自身的表示後計算雙方的匹配度。然而,在互聯網求職招聘場景下,除了求職者與招聘者雙方的文本資訊之外,還存在大量的歷史交互行為資訊可以應用於人崗匹配推薦任務。

問題定義

在本文定義的人崗匹配推薦任務中,每個崗位文檔由多句崗位職責與任職要求組成,每個簡歷文檔由多句相關工作經驗組成。在實際應用場景下,求職招聘數據中的招聘者與求職者雙方天然帶有歷史行為記錄資訊。例如,一個求職者曾經面試過哪些崗位會被記錄,同時一個崗位曾經面試過哪些求職者也會被記錄。這些面試溝通記錄可以作為標註數據供模型學習雙方的偏好。本文的目標是給定一個求職者及其歷史面試記錄,以及一個招聘崗位及其歷史面試記錄作為輸入,去預測求職者與招聘崗位之間的匹配分數,從而判斷將求職者推薦給該崗位是否合適。

方法描述

如圖所示,文本提出的模型由招聘者與求職者雙邊對稱的表示學習網路,以及匹配網路三部分組成。

在崗位描述表示學習網路中,模型利用崗位描述文檔以及該崗位歷史上曾經面試過的求職者的簡歷文檔,通過引入記憶模組來計算帶有偏好的崗位向量表示。

1)初始化:

初始階段,模型首先對崗位描述文檔里的各個句子,以及該崗位歷史面試過的求職者的簡歷文檔內的各個句子經過層級 GRU 網路進行編碼,得到各個帶有上下文資訊的句子表示。

同時,模型將崗位文檔中的各個帶有上下文資訊的句子表示作為記憶模組的初始化。

2)記憶模組迭代:

給定一個崗位描述文檔 J,按照時間順序遍歷與該崗位發生過面試的簡歷文檔, {R1,R2,…},對記憶模組 M 進行更新與讀取的迭代操作:

a. 利用J和各個R對M進行更新(記憶模組更新)。 b. J從M中讀取偏好資訊(記憶模組讀取)。

記憶模組更新:

每步迭代的更新操作中,模型利用歷史面試記錄中的一個簡歷文檔對崗位文檔的記憶模組進行更新。模型引入『注意力機制』計算更新到當前狀態下的記憶模組里各個向量表示與崗位文檔及簡歷文檔各個句子表示的相似度,並以此來計算用來更新記憶模組的偏好資訊向量。

更新計算中,模型利用記憶模組中當前狀態下的各個向量表示,以及每個向量表示對應的當前步驟的偏好資訊向量,通過 『門控機制』 對記憶模組中各個向量表示進行更新。

記憶模組讀取:

在每輪迭代的記憶模組更新操作後,崗位描述文檔的各個帶上下文資訊的句子向量表示從記憶模組中讀取偏好資訊。讀取操作採用與更新操作中相似的『注意力機制』來計算偏好資訊向量。

並且利用「門控機制」來完成資訊讀取。

通過對記憶模組的更新與讀取的迭代操作,得到最終帶有偏好資訊的崗位描述表示。

採用對稱的方式,在求職者的簡歷文檔的表示學習中,模型遍歷該求職者歷史曾經面試過的崗位描述文檔,得到最終的簡歷表示。

3)匹配

對記憶模組的更新讀取迭代操作完成後,模型對求職者的簡歷文檔中各個帶有上下文資訊的句子表示通過 max-pooling 得到簡歷的文檔向量表示。採用同樣的方式可以得到帶有偏好資訊的崗位描述文檔表示。以上述兩個文檔表示為輸入,模型利用 MLP 網路計算匹配分數。優化的目標是極大化發生面試的崗位描述與簡歷文檔之間的得分,極小化不匹配樣本對之間的得分。

實驗效果

本文基於在線招聘平台 Boss 直聘的數據集對所提出的模型進行實驗驗證,比較的方法包括:

  1. LR:邏輯回歸模型
  2. DT:決策樹模型
  3. NB:樸素貝葉斯模型
  4. RF:隨機森林模型
  5. GBDT:梯度提升決策樹模型

上述模型是基於傳統機器學習的方法,此外我們還引入了基於深度匹配模型的方法 PJFNN[1] 和 AAPJF[2] 進行實驗比較。 6. HRNNM:基於層級 GRU 編碼的文檔匹配模型 7. PJFNN:[1] 中提出的基於卷積神經網路的匹配模型 8. AAPJF:[2] 中提出的基於層級注意力機制的匹配模型

實驗結果顯示本文提出的模型在各個指標上均優於 state-of-the-art 的模型,並且指標的提升通過了顯著性檢驗。此外,對記憶模組的消融實驗進一步驗證了對求職者與招聘者的歷史行為偏好建模均有助於提升人崗匹配推薦系統的效果。

參考文獻

[1] Zhu C, Zhu H, Xiong H, et al. Person-Job Fit: Adapting the Right Talent for the Right Job with Joint Representation Learning[J]. ACM Transactions on Management Information Systems (TMIS), 2018, 9(3): 12.

[2] Qin C, Zhu H, Xu T, et al. Enhancing person-job fit for talent recruitment: An ability-aware neural network approach[C]//The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. ACM, 2018: 25-34.