RS(1)-10分鐘了解什麼是推薦系統 - ⎝⎛CodingNote.cc ⎞⎠

RS(1)–10分鐘了解什麼是推薦系統

2020 年 2 月 12 日
筆記

總第 110 篇文章，本文大約 3200 字，閱讀大約需要 10 分鐘

2020 年第一篇技術文章，以一個新的系列開始–推薦系統（Recommend System），第一篇文章會簡單介紹推薦系統的定義和應用，目錄如下：

什麼是推薦系統
你真的需要推薦系統嗎
推薦系統的問題模式
推薦系統存在的問題
推薦系統的應用

什麼是推薦系統

來自維基百科的定義：

推薦系統是一種資訊過濾系統，手段是預測用戶(user)對物品(item)的評分和偏好。

進一步從以下三個方面來回答這個問題

1. 推薦系統能做什麼–推薦系統最終可以把那些會在用戶和物品之間產生的連接提前找出來。

這裡說的連接，含義非常廣泛，凡是能夠產生關係的都是連接，包括用戶對物品的行為，或者用戶的某些屬性和物品的某些屬性。

這裡這麼說的依據是基於這樣一個事實：萬事萬物都有相互連接的大趨勢。

2. 推薦系統需要什麼–需要已經存在的連接，從已有的連接去預測未來的連接。

3. 推薦系統怎麼做–預測用戶評分和偏好。具體說就是機器推薦和人工推薦，也就是通常說的個性化推薦和編輯推薦。

總體來說，推薦系統實際上是在目前資訊爆炸的時代，可以幫助用戶過濾大量無效資訊，獲取到感興趣的資訊或者物品的演算法，並且也可以挖掘出一些長尾物品。當然，過度依賴推薦系統，實際上也可能讓你只接受到同一類的資訊或者單一領域的物品，這也是推薦系統存在的一個問題，探索與利用問題。

推薦系統是如何工作的呢？這裡可以用一個看電影的例子來解釋，比如我們在不確定看什麼電影的時候，通常可能會有這幾種方法來做決定：

諮詢朋友。不僅是問朋友，也可能是發個朋友圈或者發微博，即利用社交產品來問這個問題。這種方式在推薦系統中成為社會化推薦（social recommendation），即讓好友推薦；
我們也可能因為演員或者導演來決定看什麼電影，可能的做法就是通過搜索引擎來搜索喜歡的演員和導演有沒有在上映的電影，或者是還沒看過的電影。這種方式叫做基於內容的推薦（content-based filtering）
我們也還會打開豆瓣，查看豆瓣的電影排行榜，看看哪些高分電影是不錯的，或者通過和自己歷史興趣形似的用戶，查看他們看過的電影，然後選擇一部自己感興趣的來看。這種方式叫做基於協同過濾（collaborative filtering）的推薦，也就是根據相似用戶或者相似物品來進行推薦。

上述也只是3種推薦方式，實際上推薦系統還有其他的推薦方法，但本質上都是需要用戶和物品之間存在連接，通過已有的連接來預測未來的連接。

你需要推薦系統嗎

從兩個方面考慮這個問題：

產品的目的。如果一個產品的目的是建立的連接越多越好，那最終需要一個推薦系統。反之，對於工具類的產品，並不需要推薦系統；
產品現有的連接。當產品中的物品很少，少到人工可以應付的時候，用戶產生的連接肯定也不多，這時候連接的瓶頸在於物品數量，這時候不適合搭建推薦系統；另一種情況就是物品不少，但用戶產生的連接也不多，這種情況就是用戶留存回訪很少，需要的是找到用戶流失原因，而不是推薦系統。

這裡有一個簡單的判斷是否需要推薦系統的公式：

分子表示增加的連接數量，分母就是增加的活躍用戶數和增加的有效物品數。

這個簡單的指標是這樣的：

如果增加連接數主要依靠活躍用戶數和物品數，那麼這個指標會很小，表示不適合推薦系統
如果增加的連接數和新增活躍用戶數以及物品關係不大，說明連接數已經有自發增長的趨勢，適合加入推薦系統。

最後，是否需要推薦系統從戰術上看是需要考慮投入產出比的問題，需要組建團隊、購置計算資源、積累數據和花費時間優化等；但如果是戰略問題，那就不需要討論了。