從SpringBoot構建十萬博文聊聊高並發文章瀏覽量設計

2019 年 10 月 3 日
筆記

前言

在經歷了，緩存、限流、布隆穿透等等一系列加強功能，十萬博客基本算是成型，網站上線以後也加入了百度統計來見證十萬+ 的整個過程。

但是百度統計並不能對每篇博文進行詳細的瀏覽量統計，如果做一些熱點博文排行、48小時排行之類統計，還需要引入瀏覽量統計功能。

設計

通常情況下，我們只需要每次請求瀏覽量+1，但是這樣真的好嗎？或者更直白的講，真實瀏覽數準確嗎？

UPDATE blog SET views = views+1 WHERE id=?

參考了多個社區博客的設計，因為並不十分清楚其後端實現過程，只能從前端得出以下結論。

慕課網手記：無論是用戶登錄模式還是用戶狀態，每次刷新頁面瀏覽數都會 +1。
51CTO博客：無論是用戶登錄模式還是用戶狀態，每次刷新頁面瀏覽數都會 +1。
簡書：用戶登錄模式下，無論如何刷新瀏覽數都不會新增，但是遊客狀態下每次刷新瀏覽數都會+1。
博客園：無論是用戶登錄模式還是用戶狀態，每次刷新頁面瀏覽數都不變，即使隔天訪問，也不變，沒細測。
微信公眾號：只能是用戶登錄狀態，每次刷新瀏覽數基本不變，有時候會出現由多變少的情況，不知道大家有沒有發現。
CSDN博客：無論是用戶登錄模式還是用戶狀態，每次刷新頁面瀏覽數都不變，但是隔天訪問，瀏覽數會+1，沒細測。

基於以上社區的數據，直接 Pass 掉前兩位，總結了以下幾種方案，都是基於緩存標識實現。

如果遊客或者登錄用戶訪問，按照 IP + 文章 ID 維度增加瀏覽數，那局域網中怎麼算？
如果是遊客訪問，按照 IP + 瀏覽器SessionId + 文章 ID 維度增加瀏覽數，可能解決局域網問題，那麼關閉瀏覽器，重新打開又怎麼算？
如果是登錄用戶，用戶ID + 文章 ID 維度增加瀏覽數，那麼遊客在登錄後算不算一個瀏覽數，或者是用戶換個 IP 登錄算不算？

所以說，怎麼算都不準確，瀏覽數本身就是一個不需要太精確的功能，不要想太多，直接使用 IP + 文章ID 維度即可。

方案

方案一

得到 GET 請求，在限流之後，緩存之前，判斷緩存中是否存在 IP+ 文章ID是否存在 Key。

如果存在，說明之前瀏覽過，就什麼也不做。如果沒有，就加上這個 Key，根據業務設置緩存失效時間，然後更新數據庫瀏覽量+1，下面是代碼實現：

//獲取 Key  String key = IPUtils.getIpAddr()+":blog:"+id;  //判斷是否存在  boolean flag =  redisUtil.hasKey(key);  if(!flag){      //設置緩存標識並更新數據庫      redisUtil.set(key,"true",36000);      String nativeSql = "UPDATE blog SET views = views+1 WHERE id=?";      dynamicQuery.nativeExecuteUpdate(nativeSql,new Object[]{id});  }

方案二

這樣基本能保證真實的博文瀏覽量，你以為就這麼結束了嗎？我們做的可是一個高並發的博客，直接落庫，顯得不是逼格太 Low 了！

為了進一步提升性能力，來做下一步優化，判斷不存在之後，先不急於更新數據庫，先在 Redis 里給這篇文章的瀏覽量+1，Key 為 viewCount:articleId，value 為緩存的瀏覽量。然後設置一個定時任務，定時更新 Redis 緩存數據到數據庫。

這樣，是不是逼格一下子提升了好幾個檔次！！！下面來介紹一款更有逼格的第三方計數工具。

方案三

一款高並發計數神器 Redis HyperLogLog，她是用來做基數統計的算法，優點是，在輸入元素的數量或者體積非常非常大時，計算基數所需的空間總是固定的、並且是很小的。

在 Redis 裏面，每個 HyperLogLog 鍵只需要花費 12 KB 內存，就可以計算接近 2^64 個不同元素的基數。這和計算基數時，元素越多耗費內存就越多的集合形成鮮明對比。

什麼是基數？比如數據集 {1, 3, 5, 7, 5, 7, 8}，那麼這個數據集的基數集為 {1, 3, 5 ,7, 8}, 基數(不重複元素)為5。

為了校驗準確性，博主特意測試了一下，分別測試了，20000 和 100000 的數據量，基本上用了 12KB。

在測試之前 info 查詢一下：

used_memory_human:910.14K

測試之後，可以說基本差不多：

used_memory_human:922.27K

下面我們通過代碼來實現，引入 redis starter：

<dependency>         <groupId>org.springframework.boot</groupId>         <artifactId>spring-boot-starter-data-redis</artifactId>  </dependency>

這裡，我們只需要兩個API即可：

/**   * 計數   *  https://blog.52itstyle.vip   * @param key   * @param value   */  public void add(String key, Object... value) {      redisTemplate.opsForHyperLogLog().add(key,valu);  }  /**    * 獲取總數    *  https://blog.52itstyle.vip    * @param key    */  public Long size(String key) {      return redisTemplate.opsForHyperLogLog().size(key);  }

然後寫個AOP：

@Around("ServiceAspect()")  public  Object around(ProceedingJoinPoint joinPoint) {       Object[] object = joinPoint.getArgs();       Object blogId = object[0];       Object obj = null;       try {           String value = IPUtils.getIpAddr();           String key = "viewCount:" + blogId;           // key 為 文章ID，Value 為請求IP地址           redisUtil.add(key,value);           obj = joinPoint.proceed();       } catch (Throwable e) {           e.printStackTrace();       }       return obj;  }

博文請求：

/**    * 博文    *  https://blog.52itstyle.vip    */  @RequestMapping("{id}.shtml")  public String page(@PathVariable("id") Long id, ModelMap model) {       try{           Blog blog = blogService.getById(id);           String key = "viewCount:"+id;           Long views = redisUtil.size(key);           //直接從緩存中獲取並與之前的數量相加           blog.setViews(views+blog.getViews());           model.addAttribute("blog",blog);       } catch (Throwable e) {           return  "error/404";       }       return  "article";  }

業務代碼：

/**    *  https://blog.52itstyle.vip    * 執行順序    * 1）限流    * 2）布隆    * 3）計數    * 4) 緩存    * @param id    * @return    */  @Override  @ServiceLimit(limitType= ServiceLimit.LimitType.IP)  @BloomLimit  @HyperLogLimit  @Cacheable(cacheNames ="blog")  public Blog getById(Long id) {       String nativeSql = "SELECT * FROM blog WHERE id=?";       return dynamicQuery.nativeQuerySingleResult(Blog.class,nativeSql,new Object[]{id});  }

最後，寫個定時任務，夜間入庫：

@Scheduled(cron = "0 30 23 * * ?")  public void createHyperLog() {       logger.info("計數落庫開始");       String nativeSql = "SELECT id FROM blog";       List<Object> list = dynamicQuery.query(nativeSql,new Object[]{});       list.forEach(blogId ->{           String key  = "viewCount:"+blogId;           Long views = redisUtil.size(key);           if(views>0){               String updateSql = "UPDATE blog SET views=views+? WHERE id=?";                  dynamicQuery.nativeExecuteUpdate(updateSql,new Object[]{views,blogId});                  redisUtil.del(key);           }       });       logger.info("計數落庫結束");  }

小結

擼完計數功能，作為一個個人博客基本上差不多了已經，前後端框架、連接池、限流、緩存、計數、動靜分離，HTTPS安全認證、百度收錄等等，後面會追加後台管理，模板、插件等等一系列功能，有興趣的小夥伴可以一起參與進來啊啊啊啊啊啊……

案例

源碼：https://gitee.com/52itstyle/spring-boot-blog

列表：https://blog.52itstyle.top/index

博文：https://blog.52itstyle.top/51.html

參考

Redis HyperLogLog

神奇的HyperLogLog算法

從SpringBoot構建十萬博文聊聊高並發文章瀏覽量設計

前言

設計

方案

方案一

方案二

方案三

小結

案例

參考

VirMach 便宜 VPS

QNews

從SpringBoot構建十萬博文聊聊高並發文章瀏覽量設計

前言

設計

方案

方案一

方案二

方案三

小結

案例

參考

分享此文：

Related Posts

觀察者模式在SAP ui5修改theme實現中的應用

某大廠員工感慨：裸辭3個月，從程序員到外賣員，我都經歷了什麼？

.netcore持續集成測試篇之 .net core 2.1項目集成測試

淺談神經網絡中的激活函數

VirMach 便宜 VPS

QNews

熱門搜尋