集群、限流、緩存 BAT 大廠無非也就是這麼做 - ⎝⎛CodingNote.cc ⎞⎠

集群、限流、緩存 BAT 大廠無非也就是這麼做

2019 年 10 月 3 日
筆記

前言

前陣子有網友詢問，如何優化網站？這個問題真的很大，跟他簡單的聊了一下，隨便說了幾點，覺得有必要整理一篇文章出來，正好前陣子在做爬蟲博客，於是把大體思路分享出來，與大家互通有無，共同進步。

優化

版本一

系統開始是這樣子的，一個 Tomcat 拖着一個 MySql 服務，跑在一個 2C 4G 的Linux服務器上，所有的請求都走 Tomcat，所有的查詢都走 MySql，看起來像一句廢話？

資源是有限的，那麼如何有效的利用資源，提升服務性能？Tomcat 號稱能抗住數十萬並發訪問，但是這事也得分場景，還得有足夠牛逼的機器。

Tomcat 優化

Tomcat支持以下三種模式：

BIO：一個線程處理一個請求，缺點：並發量高時，線程數較多，浪費資源，Tomcat7或以下在Linux系統中默認使用這種方式。
NIO：利用Java的異步IO處理，可以通過少量的線程處理大量的請求。Tomcat8在Linux系統中默認使用這種方式。Tomcat7 必須修改Connector配置來啟（conf/server.xml配置文件）：

<Connector port="8080"            protocol="org.apache.coyote.http11.Http11NioProtocol"            connectionTimeout="20000"            redirectPort="8443"/>

APR(Apache Portable Runtime)：從操作系統層面解決io阻塞問題。Linux如果安裝了apr和native，Tomcat直接啟動就支持apr。

為了方便易用這裡我們選擇NIO模式，小夥伴們直接下載使用 Tomcat8 以上版本即可，連接池什麼的一般使用默認的即可。

版本二

可能部分小夥伴知道 Tomcat 容器處理靜態請求的性能力並不強，所以這裡需要一款能處理靜態文件請求又超牛逼的服務，這裡推薦 Nginx，當然你可以使用其變種 Tengine、OpenResty 才實現動靜分離。

版本三

後端服務鏈接資源是寶貴的，在高並發下，會拖慢整個系統的響應時間。這裡我們可以把一些熱點數據進行緩存，後端讀取緩存，如果數據存在則直接返回，否則再去讀取數據庫。

版本四

資源是有限的，但用戶可能是無限的，還可能有一些惡意用戶、爬蟲、熱點搜索。為了大部門用戶可以正常訪問，這裡我們使用前置限流，通過令牌桶算法或者漏桶算法實現多樣的限流方案。

版本五

在博客系統中，為了提升響應速度，加入了 Redis 緩存，把文章主鍵 ID 作為 key 值去緩存查詢，如果不存在對應的 value，就去數據庫中查找。這個時候，如果請求的並發量很大，就會對後端的數據庫服務造成很大的壓力。這裡我們使用布隆過濾器對空命中進行攔截處理。

終極版

如果僅僅對於一個博客而已一個Nginx 足夠了，後面可以帶多個Tomcat 做負載均衡進群
Nginx 應用層面做限流，後端單個服務可以做接口限流
後端服務用戶 Session 可以集中存儲到 Redis 中
布隆過濾攔截防止緩存穿透
熱點數據讀取 Redis 緩存
如有必要 Redis 、MySql 可以做主從集群

小結

優化過程可能僅僅是冰山一角，但大體思路差不多就是這個樣子，發現問題然後解決問題，本來架構就是演進而來的。

參考

從SpringBoot構建十萬博文聊聊緩存穿透

SpringBoot開發案例之打造十萬博文Web篇

從SpringBoot構建十萬博文聊聊高並發文章瀏覽量設計

從0到1構建分佈式秒殺系統，脫離案例講架構都是耍流氓

很多小夥伴問作圖工具是什麼？點這裡：https://www.processon.com/i/58c8a5c7e4b06344137ffc14

Previous post

「每日五分鐘，玩轉JVM」：線程共享區

Next post

Scala 系列（八）—— 類和對象