­

機器學習系列23:基於內容的推薦算法

  • 2019 年 10 月 7 日
  • 筆記

如今,推薦算法已經深入到我們生活的各個方面,比如說淘寶根據我們之前的瀏覽記錄給我們推薦想要購買的商品;抖音不停地給我們推薦各種我們感興趣的視頻(雖然我個人不太喜歡抖音,覺得抖音會讓我們喪失獨立思考的能力,但是它的推薦算法還是很厲害的)

。。。

這些推薦算法極大地便捷了我們的生活,身為一個學習機器學習的同學,怎麼能不關注一下推薦算法呢?

下面來舉個栗子:如今有一個電影推薦系統,用戶可以給電影進行評分,從 0 分到 5 分,有些電影沒有被打過分就記做未知,最終目的就是想通過一個推薦算法把某些電影推薦給可能對他感興趣的用戶。

綠圈表示這是一類愛情電影,紅圈表示這是動作電影,由以上數據可以看出,前兩位用戶對愛情片可能感興趣,而後兩位用戶對動作片可能感興趣。基於此,我們可以用類似於線性回歸的方法去預測沒有看過此電影的用戶可能對此電影的評分,在用這種方法之前,我們需要先求出每個電影的特徵:

之後,具體的方法如下:

與線性回歸有一點點的區別就是它被省略了 1/m。這是對一個用戶進行預測,要考慮到所有的用戶,就要進行求和:

之後再進行梯度下降等一系列操作。。。最終就能得到一個基於內容的推薦算法了。