​金融風控的護航員——聊聊ERNIE在度小滿用戶風控的應用

  • 2019 年 11 月 11 日
  • 筆記

如今,隨著技術的發展,對於普通消費用戶來講,想在網上借點錢花變得越來越容易,技術帶給我們的便利性日漸突顯。同時,隨著消費金融的興起,徵信體系成為了消費金融公司發展背後的主要障礙之一,信貸欺詐大量湧現。這給金融行業的發展帶來了極大的阻礙,致使很多借貸行為無法圓滿解決。

這個問題有多嚴重?

央行發布的《2018年第三季度支付體系運行總體情況》顯示,中國信用卡逾期半年未償信貸總額880.98億元,環比增長16.43%。

這意味著金融行業的風控需求異常迫切。面對更加下沉的客戶群體、更加複雜的用戶資訊,既需要保證業務安全合規,也需要把控風控尺度和客戶體驗之間的平衡。

那麼現在的金融機構是如何做這些的呢?

傳統金融機構里會請金融風控師、審核員等對借貸資質進行人工審核,但該工作對相關從業人員的要求極高,既要有相關的背景知識能夠對客戶的資信狀況做全面了解,又要求嚴謹認真,有獨立的判斷能力。同時,隨著互聯網金融的發展,每天在平台上發上的借貸行為數以萬計,對於人力的消耗非常巨大,審核標準的統一性、效率都難以保證。

另外,傳統的風控建模技術是基於小樣本的監督學習,依賴於特徵挖掘,需要耗費大量人力且依賴個人經驗。同時,對於小樣本的文本類數據處理往往缺乏對上下文的理解,無法提取其重點,導致對用戶的理解出現偏差。

那怎麼辦?這些難題如何破?

度小滿目前為用戶提供教育貸和教育現金貸等業務,旨在「讓每一個夢想有錢花」,幫助用戶進一步深造自己或者學習新的職業技能,屬於非常普惠的項目。

度小滿本次與百度的合作,目標是將百度自研的持續學習語義理解框架ERNIE應用到度小滿的用戶風控場景中。

ERNIE通過建模超大規模數據中的詞、實體以及實體之間的關係,能夠學習到真實世界中豐富的語義知識,因而對於中文語義理解相較於傳統神經網路更深入。預訓練語言模型ERNIE蘊含豐富的語義知識,因而能夠將其應用於需要文本語義理解的場景,只需將預訓練ERNIE在少量的人工標註數據上進行Finetune,就可以得到一個任務訂製化的ERNIE模型。訂製化的ERNIE模型不僅學習到特定任務訓練數據中的資訊,還蘊含其預訓練的語言模型資訊,因此該模型能夠達到非常好的效果。

在度小滿用戶風控場景中,通過ERNIE對用戶行為資訊進行語義層面深度建模,訂製化產出一個用戶風控ERNIE模型。利用ERNIE模型的長文本建模能力和預訓練語義知識,結合小規模用戶行為文本和用戶風控標籤的標註數據進行ERNIE精細Fine-tune,在訓練2輪左右的時間內即可完成用戶風控模型的收斂,而傳統模型動輒需要訓練100輪模型才能收斂。模型收斂速度提升50倍,由此可見ERNIE具有收斂快、擬合強、泛化好等優點。

基於ERNIE的度小滿金融風控模型KS指標絕對提升1.5,AUC指標絕對提升1.5,優化了21.5%的用戶排序,有效地提升了優質客群人數,有效地降低了貸款風險並且大幅度減少審核人力。

未來雙方還將進一步深入合作,將ERNIE強大的語義理解能力應用到更多的金融領域應用場景中,如:金融獲客、貸中管理等,助力金融行業的健康發展。