性能優化指南（5000 字小結）

2019 年 10 月 29 日
筆記

來源：cnblogs.com/xybaby/p/9055734.html

一般性原則
性能優化的層次
一般性方法
- 快取
- 並發
- 惰性
- 批量，合併
- 更高效的實現
- 縮小解空間
性能優化與程式碼品質
總結

作為一個程式設計師，性能優化是常有的事情，不管是桌面應用還是web應用，不管是前端還是後端，不管是單點應用還是分散式系統。本文從以下幾個方面來思考這個問題：性能優化的一般性原則，性能優化的層次，性能優化的通用方法。本文不限於任何語言、框架，不過可能會用Python語言來舉例。

不過囿於個人經驗，可能更多的是從Linux服務端的角度來思考這些問題。

一般性原則

依據數據而不是憑空猜測

這是性能優化的第一原則，當我們懷疑性能有問題的時候，應該通過測試、日誌、profillig來分析出哪裡有問題，有的放矢，而不是憑感覺、撞運氣。一個系統有了性能問題，瓶頸有可能是CPU，有可能是記憶體，有可能是IO（磁碟IO，網路IO），大方向的定位可以使用top以及stat系列來定位（vmstat，iostat，netstat…），針對單個進程，可以使用pidstat來分析。

在本文中，主要討論的是CPU相關的性能問題。按照80/20定律，絕大多數的時間都耗費在少量的程式碼片段裡面，找出這些程式碼唯一可靠的辦法就是profile，我所知的程式語言，都有相關的profile工具，熟練使用這些profile工具是性能優化的第一步。

忌過早優化

The real problem is that programmers have spent far too much time worrying about efficiency in the wrong places and at the wrong times; premature optimization is the root of all evil (or at least most of it) in programming.

我並不十分清楚Donald Knuth說出這句名言的上下文環境，但我自己是十分認同這個觀念的。在我的工作環境（以及典型的互聯網應用開發）與編程模式下，追求的是快速的迭代與試錯，過早的優化往往是無用功。而且，過早的優化很容易拍腦袋，優化的點往往不是真正的性能瓶頸。

忌過度優化

As performance is part of the specification of a program – a program that is unusably slow is not fit for purpose

性能優化的目標是追求合適的性價比。

在不同的階段，我們對系統的性能會有一定的要求，比如吞吐量要達到多少多少。如果達不到這個指標，就需要去優化。如果能滿足預期，那麼就無需花費時間精力去優化，比如只有幾十個人使用的內部系統，就不用按照十萬在線的目標去優化。

而且，後面也會提到，一些優化方法是「有損」的，可能會對程式碼的可讀性、可維護性有副作用。這個時候，就更不能過度優化。

深入理解業務

程式碼是服務於業務的，也許是服務於最終用戶，也許是服務於其他程式設計師。不了解業務，很難理解系統的流程，很難找出系統設計的不足之處。後面還會提及對業務理解的重要性。

性能優化是持久戰

當核心業務方向明確之後，就應該開始關注性能問題，當項目上線之後，更應該持續的進行性能檢測與優化。

現在的互聯網產品，不再是一鎚子買賣，在上線之後還需要持續的開發，用戶的湧入也會帶來性能問題。因此需要自動化的檢測性能問題，保持穩定的測試環境，持續的發現並解決性能問題，而不是被動地等到用戶的投訴。

選擇合適的衡量指標、測試用例、測試環境

正因為性能優化是一個長期的行為，所以需要固定衡量指標、測試用例、測試環境，這樣才能客觀反映性能的實際情況，也能展現出優化的效果。

衡量性能有很多指標，比如系統響應時間、系統吞吐量、系統並發量。不同的系統核心指標是不一樣的，首先要明確本系統的核心性能訴求，固定測試用例；其次也要兼顧其他指標，不能顧此失彼。

測試環境也很重要，有一次突然發現我們的QPS高了許多，但是程式壓根兒沒優化，查了半天，才發現是換了一個更牛逼的物理機做測試伺服器。

性能優化的層次

按照我的理解可以分為需求階段，設計階段，實現階段；越上層的階段優化效果越明顯，同時也更需要對業務、需求的深入理解。

需求階段

不戰而屈人之兵，善之善者也

程式設計師的需求可能來自PM、UI的業務需求（或者說是功能性需求），也可能來自Team Leader的需求。當我們拿到一個需求的時候，首先需要的是思考、討論需求的合理性，而不是立刻去設計、去編碼。

需求是為了解決某個問題，問題是本質，需求是解決問題的手段。那麼需求是否能否真正的解決問題，程式設計師也得自己去思考，在之前的文章也提到過，產品經理（特別是知道一點技術的產品經理）的某個需求可能只是某個問題的解決方案，他認為這個方法可以解決他的問題，於是把解決方案當成了需求，而不是真正的問題。

需求討論的前提對業務的深入了解，如果不了解業務，根本沒法討論。即使需求已經實現了，當我們發現有性能問題的時候，首先也可以從需求出發。

需求分析對性能優化有什麼幫助呢，第一，為了達到同樣的目的，解決同樣問題，也許可以有性能更優（消耗更小）的辦法。這種優化是無損的，即不改變需求本質的同時，又能達到性能優化的效果；第二種情況，有損的優化，即在不明顯影響用戶的體驗，稍微修改需求、放寬條件，就能大大解決性能問題。PM退步一小步，程式前進一大步。

需求討論也有助於設計時更具擴展性，應對未來的需求變化，這裡按下不表。

設計階段

高手都是花80%時間思考，20%時間實現；新手寫起程式碼來很快，但後面是無窮無盡的修bug

設計的概念很寬泛，包括架構設計、技術選型、介面設計等等。架構設計約束了系統的擴展、技術選型決定了程式碼實現。程式語言、框架都是工具，不同的系統、業務需要選擇適當的工具集。如果設計的時候做的不夠好，那麼後面就很難優化，甚至需要推到重來。

實現階段

實現是把功能翻譯成程式碼的過程，這個層面的優化，主要是針對一個調用流程，一個函數，一段程式碼的優化。各種profile工具也主要是在這個階段生效。除了靜態的程式碼的優化，還有編譯時優化，運行時優化。後二者要求就很高了，程式設計師可控性較弱。

程式碼層面，造成性能瓶頸的原因通常是高頻調用的函數、或者單次消耗非常高的函數、或者二者的結合。

下面介紹針對設計階段與實現階段的優化手段。

一般性方法

快取

沒有什麼性能問題是快取解決不了的，如果有，那就再加一級快取

a cache /kæʃ/ KASH,[1] is a hardware or software component that stores data so future requests for that data can be served faster; the data stored in a cache might be the result of an earlier computation, or the duplicate of data stored elsewhere.

快取的本質是加速訪問，訪問的數據要麼是其他數據的副本 — 讓數據離用戶更近；要麼是之前的計算結果 — 避免重複計算.

快取需要用空間換時間，在快取空間有限的情況下，需要優秀的置換換算來保證快取有較高的命中率。

數據的快取

這是我們最常見的快取形式，將數據快取在離使用者更近的地方。比如作業系統中的CPU cache、disk cache。對於一個web應用，前端會有瀏覽器快取，有CDN，有反向代理提供的靜態內容快取；後端則有本地快取、分散式快取。

數據的快取，很多時候是設計層面的考慮。

對於數據快取，需要考慮的是快取一致性問題。對於分散式系統中有強一致性要求的場景，可行的解決辦法有lease，版本號。

計算結果的快取

對於消耗較大的計算，可以將計算結果快取起來，下次直接使用。

我們知道，對遞歸程式碼的一個有效優化手段就是快取中間結果，lookup table，避免了重複計算。python中的method cache就是這種思想。

對於可能重複創建、銷毀，且創建銷毀代價很大的對象，比如進程、執行緒，也可以快取，對應的快取形式如單例、資源池（連接池、執行緒池）。

對於計算結果的快取，也需要考慮快取失效的情況，對於pure function，固定的輸入有固定的輸出，快取是不會失效的。但如果計算受到中間狀態、環境變數的影響，那麼快取的結果就可能失效，比如這篇文章講到的：

http://www.cnblogs.com/xybaby/p/8403461.html#_label_6

並發

一個人干不完的活，那就找兩個人干。並發既增加了系統的吞吐，又減少了用戶的平均等待時間。

這裡的並發是指廣義的並發，粒度包括多機器（集群）、多進程、多執行緒。

對於無狀態（狀態是指需要維護的上下文環境，用戶請求依賴於這些上下文環境）的服務，採用集群就能很好的伸縮，增加系統的吞吐，比如掛載nginx之後的web server

對於有狀態的服務，也有兩種形式，每個節點提供同樣的數據，如mysql的讀寫分離；每個節點只提供部分數據，如mongodb中的sharding

分散式存儲系統中，partition（sharding）和replication（backup）都有助於並發。

絕大多數web server，要麼使用多進程，要麼使用多執行緒來處理用戶的請求，以充分利用多核CPU，再有IO阻塞的地方，也是適合使用多執行緒的。比較新的協程（Python greenle、goroutine）也是一種並發。

惰性

將計算推遲到必需的時刻，這樣很可能避免了多餘的計算，甚至根本不用計算，參見：

http://www.cnblogs.com/xybaby/p/6425735.html

CopyOnWrite這個思想真牛逼！

批量，合併

在有IO（網路IO，磁碟IO）的時候，合併操作、批量操作往往能提升吞吐，提高性能。

我們最常見的是批量讀：每次讀取數據的時候多讀取一些，以備不時之需。如GFS client會從GFS master多讀取一些chunk資訊；如分散式系統中，如果集中式節點複雜全局ID生成，俺么應用就可以一次請求一批id。

特別是系統中有單點存在的時候，快取和批量本質上來說減少了與單點的交互，是減輕單點壓力的經濟有效的方法

在前端開發中，經常會有資源的壓縮和合併，也是這種思想。

當涉及到網路請求的時候，網路傳輸的時間可能遠大於請求的處理時間，因此合併網路請求就很有必要，比如mognodb的bulk operation，redis 的pipeline。寫文件的時候也可以批量寫，以減少IO開銷，GFS中就是這麼乾的

更高效的實現

同一個演算法，肯定會有不同的實現，那麼就會有不同的性能；有的實現可能是時間換空間，有的實現可能是空間換時間，那麼就需要根據自己的實際情況權衡。

程式設計師都喜歡造輪子，用於練手無可厚非，但在項目中，使用成熟的、經過驗證的輪子往往比自己造的輪子性能更好。當然不管使用別人的輪子，還是自己的工具，當出現性能的問題的時候，要麼優化它，要麼替換掉他。

比如，我們有一個場景，有大量複雜的嵌套對象的序列化、反序列化，開始的時候是使用python（Cpython）自帶的json模組，即使發現有性能問題也沒法優化，網上一查，替換成了ujson，性能好了不少。

上面這個例子是無損的，但一些更高效的實現也可能是有損的，比如對於python，如果發現性能有問題，那麼很可能會考慮C擴展，但也會帶來維護性與靈活性的喪失，面臨crash的風險。

縮小解空間

縮小解空間的意思是說，在一個更小的數據範圍內進行計算，而不是遍歷全部數據。最常見的就是索引，通過索引，能夠很快定位數據，對資料庫的優化絕大多數時候都是對索引的優化。

如果有本地快取，那麼使用索引也會大大加快訪問速度。不過，索引比較適合讀多寫少的情況，畢竟索引的構建也是需有消耗的。

另外在遊戲服務端，使用的分線和AOI（格子演算法）也都是縮小解空間的方法。

性能優化與程式碼品質

很多時候，好的程式碼也是高效的程式碼，各種語言都會有一本類似的書《effective xx》。比如對於python，pythonic的程式碼通常效率都不錯，如使用迭代器而不是列表（python2.7 dict的iteritems(), 而不是items())。

衡量程式碼品質的標準是可讀性、可維護性、可擴展性，但性能優化有可能會違背這些特性，比如為了屏蔽實現細節與使用方式，我們會可能會加入介面層（虛擬層），這樣可讀性、可維護性、可擴展性會好很多，但是額外增加了一層函數調用，如果這個地方調用頻繁，那麼也是一筆開銷；又如前面提到的C擴展，也是會降低可維護性、

這種有損程式碼品質的優化，應該放到最後，不得已而為之，同時寫清楚注釋與文檔。

為了追求可擴展性，我們經常會引入一些設計模式，如狀態模式、策略模式、模板方法、裝飾器模式等，但這些模式不一定是性能友好的。所以，為了性能，我們可能寫出一些反模式的、訂製化的、不那麼優雅的程式碼，這些程式碼其實是脆弱的，需求的一點點變動，對程式碼邏輯可能有至關重要的影響，所以還是回到前面所說，不要過早優化，不要過度優化。

總結

來張腦圖總結一下

性能優化指南（5000 字小結）

一般性原則

性能優化的層次

一般性方法

快取

並發

惰性

批量，合併

更高效的實現

縮小解空間

性能優化與程式碼品質

總結

VirMach 便宜 VPS

QNews

性能優化指南（5000 字小結）

一般性原則

性能優化的層次

一般性方法

快取

並發

惰性

批量，合併

更高效的實現

縮小解空間

性能優化與程式碼品質

總結

分享此文：

Related Posts

聊聊運營活動的設計與實現邏輯

【工作篇】介面冪等問題探究

MongoDB 是什麼 ? 能幹嘛 ？

JVM 線上故障排查基本操作

VirMach 便宜 VPS

QNews

熱門搜尋

MongoDB 是什麼 ? 能幹嘛？