機器學習之排序學習

2020 年 12 月 25 日
筆記

Learn to Rank

排序學習主要用於搜索引擎，推薦系統等領域。

對於傳統的排序演算法，一般只能根據少量特徵，然後通過人為設定的規則，來進行文檔的全量排序。

然而對於排序涉及大量的特徵，而且這些特徵難以人為的編輯規則來進行文檔和文檔之間的比較，這就出現了排序學習。

排序學習通過以特徵和文檔為輸入，通過機器學習或者神經網路的方法，最終輸出對於某個查詢，每個文檔的相關度分數，進而實現可以進行對文檔的排序。

範式

查詢集合Q = {q1, q2 …. qn}
文檔集合D
與第 i 個查詢 qi 相關的文檔Di = {d1 …. dm}
得到結果：相關性分數 y = {y1 … ym}

類別

PointWise

優點

可以直接利用現有的回歸和分類的理論和演算法

缺點

對於同一label級別的文檔，無法進行排序，導致某些不重要的文檔排在前面
訓練的時候僅考慮了當前文檔的特徵，忽略了本文檔與其他文檔的差別訓練

PairWise

輸出的0/1代表doc1是否大於doc2

優點

可以直接應用以後的分類演算法

缺點

僅考慮了文檔對的相對次序，很難推出列表的全序
如果前面的文檔對判斷錯誤，會直接導致後面的文檔對判斷錯誤

RankNet

ListWise

NDCG理解

rel：查詢q與文檔的相關度
CG：了耳機增益，在top-n下，rel的累加
DCG：折損累計增益，在top-n下，rel乘以一個隨位置的衰減值，表示越靠前的，權重越大，越靠後的，影響越小
IDCG：理想的DCG值，一般為訓練預期結果的DCG值
NDCG：預測的DCG/IDCG

模型輸出的DCG值

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	2	1.58	1.26
3	3	2	1.5
4	0	2.32	0
5	1	2.58	0.38
6	2	2.8	0.71

IDCG:(通過排名rel值得到)

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	3	1.58	1.89
3	3	2	1.5
4	2	2.32	0.86
5	2	2.58	0.77
6	1	2.8	0.35

非連續性

可以看出，IDCG是固定的，對DCG的優化過程，DCG的值呈現跳躍性改變，因此DCG是非連續函數，這導致以NDCG為代表的損失函數，很難使用現代的優化演算法來優化。

lambda梯度

由於NDCG的非連續性，這就引入了lambda為梯度的損失函數

lambda損失

通過定義loss的梯度，不需要通過求導，而是直接求得lambda的梯度，然後通過反向傳播到上層的model，優化模型的參數，這樣就避免了最後的loss是非連續函數不可導的缺點
最後梯度=lambda(i)
lambda>0，則趨於上升
lambda<0，則趨於下降

lambda計算

計算DCG
計算IDCG
計算deltaNDCG = |NDCG – NDCG(swap(i, j))|
lambda(i) = deltaNDCG(i>j) – deltaNDCG(i<j)

機器學習之排序學習

Learn to Rank

範式

類別

PointWise

優點

缺點

PairWise

優點

缺點

RankNet

ListWise

NDCG理解

模型輸出的DCG值

IDCG:(通過排名rel值得到)

非連續性

lambda梯度

lambda損失

lambda計算

VirMach 便宜 VPS

QNews

機器學習之排序學習

Learn to Rank

範式

類別

PointWise

優點

缺點

PairWise

優點

缺點

RankNet

ListWise

NDCG理解

模型輸出的DCG值

IDCG:(通過排名rel值得到)

非連續性

lambda梯度

lambda損失

lambda計算

分享此文：

Related Posts

「筆記」折半搜索（Meet in the Middle）

互聯網用戶畫像，精準營銷，數倉有妙招

考研天價酒店房冒頭：價格暴漲10倍 大堂沙發當客房賣

Jenkins自動化部署伺服器及git 提交及git tag標籤版本更新流程，超詳細！

VirMach 便宜 VPS

QNews

熱門搜尋

考研天價酒店房冒頭：價格暴漲10倍大堂沙發當客房賣