三年、四大高峰會,深度推薦系統18篇論文只有7個可以復現

  • 2019 年 10 月 4 日
  • 筆記

作者 | 深度傳送門

來源 | 深度傳送門(ID:gh_5faae7b50fc5)

導讀:本文是「深度推薦系統」專欄的第十篇文章,這個系列將介紹在深度學習的強力驅動下,給推薦系統工業界所帶來的最前沿的變化。本文主要根據RecSys 2019中論文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》總結的最近三年四大高峰會深度推薦系統上的18個最新演算法。

今年RecSys 2019上出現的一篇極具批判性的論文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。靈魂一問深度學習是否在推薦系統已經取得了足夠可信的進展?在知乎上也引起了激烈的討論:如何看待RecSys 2019上的一篇文章認為現有DNN-based推薦演算法帶來的基本上都是偽提升?

作者總結了過去三年四大高峰會(KDD、SIGIR、WWW和RecSys)推薦系統上18個最新演算法,只有7個能重現效果。而且在不同的測試數據集上它們與淺層經典方法效果對比中經常都敗下陣來。並開源了評估程式碼與數據集。

拋開論文中提到到目前推薦系統眾所周知的因為評估數據集、評估指標、以及

baseline調參等問題不一致導致諸多論文演算法在性能可復現上存在的諸多問題,作為產業界的演算法工程師來說更多的是需要從最新的高峰會工作中開拓視野、吸取不同的思路,來確定工業界線上系統中的下一步的迭代方向。不管黑貓白貓,只要應用在線上系統有確切實際效果的工作就是好工作。

1. Collaborative Memory Network for Recommendation Systems

作者:Travis Ebesu, Bin Shen, Yi Fang; 論文:t.cn/AiRbpFAR;程式碼:t.cn/EPRooTK;

Google at SIGIR 2018,提出CMN演算法融合記憶網路與注意力機制幫助CF類演算法捕捉user和item之間的高階複雜關係。效果好於CDAE和NeuMF等,並開源了程式碼。

2. Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model

作者:Binbin Hu, Chuan Shi, Wayne Xin Zhao, Philip S. Yu; 論文:t.cn/AiRbsEUf;程式碼:t.cn/EtOkDu7;

KDD 2018,提出MCRec演算法藉助豐富的元路徑和互注意力機制進行Top-N推薦,可以有效學習user、item以及基於元路徑的上下文的表示從而學習他們之間的交互。效果好於NeuMF等,並開源了程式碼。

3. Collaborative Variational Autoencoder for Recommender Systems

作者:Xiaopeng Li, James She; 論文:t.cn/AiRGt8SQ;程式碼:t.cn/EyWuDRS;

KDD 2017,提出CVAE考慮多媒體場景下的推薦內容與交互數據,以無監督的方式學習item和用戶的深度隱式表示以及他們之間的隱式關係。效果好於CDL等,並開源了程式碼。

4. Collaborative Deep Learning for Recommender Systems

作者:Hao Wang, Naiyan Wang, Dit-Yan Yeung; 論文:t.cn/AiRG66mD;程式碼:t.cn/AiRG66mF;

KDD 2015,針對CF類方法學慣用戶與item的交互往往過於稀疏導致推薦效果不好的問題,提出CDL演算法結合用戶交互數據與item內容輔助資訊來學習隱式表示。效果好於CTR和CMF等模型,並開源了程式碼。

5. Neural Collaborative Filtering

作者:Xiangnan He, Lizi Liao, Hanwang Zhang, Liqiang Nie, Xia Hu, Tat-Seng Chua; 論文:t.cn/ROuL87r;程式碼:t.cn/ROuhFZP;

WWW 2017,提出NCF框架使用NN網路結構代替內積形式來學慣用戶和item之間的交互,從而實現對MF類方法進行擴展。效果好於現有MF類方法,並開源了程式碼。

6. Spectral Collaborative Filtering

作者:Lei Zheng, Chun-Ta Lu, Fei Jiang, Jiawei Zhang, Philip S. Yu; 論文:t.cn/AiRM65fz;程式碼:t.cn/AiRM65VF;

RecSys 2018,提出SpectralCF演算法引入光譜圖理論結合在用戶-item二分圖上進行光譜卷積操作解決CF類演算法在推薦冷啟動問題上的弱點。效果好於NCF等,並開源了程式碼。

7. Variational Autoencoders for Collaborative Filtering

作者:Dawen Liang, Rahul G. Krishnan, Matthew D. Hoffman, Tony Jebara; 論文:t.cn/RRD6veZ;程式碼:t.cn/RRD6veA;

NetFlix at WWW 2018,基於變分自動編碼器的CF演算法。效果明顯好於NCF和CDAE等,並開源了程式碼。

8. Multi-Pointer Co-Attention Networks for Recommendation

作者:Yi Tay, Luu Anh Tuan, Siu Cheung Hui 論文:t.cn/AiRotBGQ;程式碼:t.cn/E72ViBh;

KDD 2018,基於協同注意力機制,針對用戶評論以及與商品相關的評論進行重要性選擇,用來學慣用戶與item的表示。效果好於同樣基於評論建模的D-ATT/ TransNet/DeepCoNN等,並開源了程式碼。

9. Recurrent Knowledge Graph Embedding for Effective Recommendation

作者:Zhu Sun, Jie Yang, Jie Zhang, Alessandro Bozzon, Long-Kai Huang, Chi Xu 論文:t.cn/AiRKtn8B;程式碼:t.cn/AiRKtn81;

RecSys 2018,提出一種KG embedding方法RKGE,基於RNN網路自動學習實體與實體間path的embedding表示。效果好於NCF與CKE等,並開源了程式碼。

10. RecGAN: Recurrent Generative Adversarial Networks for Recommendation Systems

作者:Homanga Bharadhwaj, Homin Park, Brian Y. Lim; 論文:t.cn/AiRKcnxT;

RecSys 2018,結合RNN和GAN提出RecGAN框架更好地學慣用戶item交互背後的時域與隱式特徵。

11. Attentive Neural Architecture Incorporating Song Features for Music Recommendation

作者:Noveen Sachdeva, Kartik Gupta, Vikram Pudi 論文:t.cn/AiEGSrxQ

RecSys 2018,基於Attention機制結合歌曲的特徵更好地學慣用戶短期興趣進行下一首音樂的推薦,效果好於RNN以及基於Session的CF類演算法。

12. 3D Convolutional Networks for Session-based Recommendation with Content Features

作者:Trinh Xuan Tuan, Tu Minh Phuong 論文:t.cn/AiEGOGz2

RecSys 2017,使用三維卷積神經網路針對序列推薦中的用戶-item交互數據以及內容特徵更好地進行建模,效果好於GRU4Rec等。

13. Convolutional Matrix Factorization for Document Context-Aware Recommendation

作者:Donghyun Kim, Chanyoung Park, Jinoh Oh, Seungyong Lee, Hwanjo Yu 論文:t.cn/AiEGRrew;程式碼:t.cn/AiEGRreA;

RecSys 2016,提出ConvMF演算法結合CNN以及概率矩陣分解PMF更好地捕捉item的上下文資訊,從而提高預測的準確度。效果好於CDL等,並開源了程式碼。

14. Meta-Prod2Vec: Product Embeddings Using Side-Information for Recommendation

作者:Flavian Vasile, Elena Smirnova, Alexis Conneau 論文:t.cn/AiEGsbzB

RecSys 2016,提出Meta-Prod2Vec演算法針對Prod2Vec演算法加入類別型side information。效果好於原有Prod2Vec。

15. A Contextual Attention Recurrent Architecture for Context-Aware Venue Recommendation

作者:Jarana Manotumruksa, Craig Macdonald, Iadh Ounis 論文:t.cn/AiEqZfuT;程式碼:t.cn/AiEqLdDT;

SIGIR 2018,提出CARA框架結合序列中的回饋資訊以及上下文資訊更好地捕獲用戶的動態偏好,進行酒店推薦。主要包含一個上下文注意力門和基於時間和地理位置門。效果好於GRU以及LatentCross等,並開源了程式碼。

16. Attentive Collaborative Filtering: Multimedia Recommendation with Item-and Component-Level Attention

作者:Jingyuan Chen, Hanwang Zhang, Xiangnan He, Liqiang Nie, Wei Liu, Tat-Seng Chua 論文:t.cn/AiEq5MT6;程式碼:t.cn/AiEq5MTA;

SIGIR 2017,提出適用於CF的注意力機制跨級啊ACF,包含component-level和item-level的注意力模組,更好地學習多媒體內容上用戶的偏好。效果好於DeepHybrid等,並開源了程式碼。

17. Latent Relational Metric Learning via Memory-based Attention for Collaborative Ranking

作者:Yi Tay, Anh Tuan Luu, Siu Cheung Hui 論文:t.cn/AiEqIszv;程式碼:t.cn/AiEqMIuC;

WWW 2018,提出一種協同推薦上新的度量學習方法LRML,旨在學慣用戶和item之間的相關關係,而不是簡單的用戶和項目之間的push和pull關係。採用了一個增強的存儲器模組,並通過這些記憶塊來構建用戶和項目潛在的關係。效果好於NeuMF和CML等,並開源了程式碼。

18. A Multi-view Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

作者:Ali Mamdouh Elkahky, Yang Song, Xiaodong He 論文:t.cn/AiEqJyzT;程式碼:t.cn/AiEqJ8iv;

微軟 at WWW 2015,基於DSSM匹配模型提出一種跨領域構建用戶模型的推薦演算法MV-DSSM框架。MV-DNN聯合了多個域做的豐富特徵進行聯合模型推薦,效果好於CTR等並開源了程式碼。

(*本文為AI科技大本營轉載文章,轉載請聯繫作者)