性能測試必備知識(10)- Linux 是怎麼管理記憶體的?

做性能測試的必備知識系列,可以看下面鏈接的文章哦

//www.cnblogs.com/poloyy/category/1806772.html

 

記憶體映射

日常生活常說的記憶體是什麼

  • 比方說,我的筆記型電腦電腦記憶體就是 8GB 的
  • 這個記憶體其實是物理記憶體
  • 物理記憶體也稱為主存,大多數電腦用的主存都是動態隨機訪問記憶體(DRAM)

 

靈魂拷問

只有內核才可以直接訪問物理記憶體,那麼進程要訪問記憶體時,怎麼辦?

 

虛擬地址空間

  • 為了解決上面的問題,Linux 內核給每個進程都提供了一個獨立的虛擬地址空間,並且這個地址空間是連續
  • 這樣,進程就可以很方便地訪問記憶體,更確切地說是訪問虛擬記憶體

 

內部

  • 虛擬地址空間的內部又被分為內核空間用戶空間兩部分
  • 不同字長(單個 CPU 指令可以處理數據的最大長度)的處理器,地址空間的範圍也不同

 

最常見的 32 位和64 位系統的虛擬地址空間

  • 32 位系統的內核空間佔用 1G,位於最高處,剩下的 3G 是用戶空間
  • 而 64 位系統的內核空間和用戶空間都是 128T,分別佔據整個記憶體空間的最高和最低處,剩下的中間部分是未定義的

 

進程的用戶態和內核態

  • 進程在用戶態時,只能訪問用戶空間記憶體
  • 只有進入內核態後,才可以訪問內核空間記憶體
  • 雖然每個進程的地址空間都包含了內核空間,但這些內核空間,其實關聯的都是相同的物理記憶體
  • 這樣,進程切換到內核態後,就可以很方便地訪問內核空間記憶體

 

為什麼會有記憶體映射

  • 既然每個進程都有一個這麼大的地址空間,那麼所有進程的虛擬記憶體加起來,自然要比實際的物理記憶體大得多
  • 所以,並不是所有的虛擬記憶體都會分配物理記憶體,只有那些實際使用的虛擬記憶體才分配物理記憶體
  • 並且分配後的物理記憶體,是通過記憶體映射來管理的

 

什麼是記憶體映射

  • 記憶體映射,其實就是將虛擬記憶體地址映射到物理記憶體地址
  • 為了完成記憶體映射,內核為每個進程都維護了一張頁表,記錄虛擬地址與物理地址的映射關係

  • 頁表實際上存儲在 CPU 的記憶體管理單元 MMU
  • 正常情況下,處理器就可以直接通過硬體,找出要訪問的記憶體
  • 在頁表的映射下,進程就可以通過虛擬地址來訪問物理記憶體了

 

靈魂拷問

么具體到 一個 Linux 進程中,這些記憶體又是怎麼使用的呢?

 

 

虛擬記憶體空間分布

回答上面的問題,需要進一步了解虛擬記憶體空間的分布情況

用戶空間記憶體,其實又被分成了多個不同的段

這是 32 位系統,用戶空間記憶體,從低到高分別是五種不同的記憶體段

  1. 只讀段:包括程式碼和常量等
  2. 數據段:包括全局變數等
  3. 堆:包括動態分配的記憶體,從低地址開始向上增長
  4. 文件映射段:包括動態庫、共享記憶體等,從高地址開始向下增長
  5. 棧:包括局部變數和函數調用的上下文等。棧的大小是固定的,一般是 8 MB

 

在這五個記憶體段中,堆和文件映射段的記憶體是動態分配

比如說,使用 C 標準庫的 malloc()  或者 mmap() ,就可以分別在堆和文件映射段動態分配記憶體

 

其實 64 位系統的記憶體分布也類似,只不過記憶體空間要大得多

 

靈魂拷問

記憶體究竟是怎麼分配的呢?

 

記憶體分配與回收

分配

 malloc() 是 C 標準庫提供的記憶體分配函數,對應到系統調用上,有兩種實現方式,即 brk() 和 mmap() 

 

brk()

  • 對小塊記憶體(小於 128K),C 標準庫使用 brk() 來分配
  • 也就是通過移動堆頂的位置來分配記憶體
  • 這些記憶體釋放後並不會立刻歸還系統,而是被快取起來,這樣就可以重複使用
  • 優點:快取可以減少缺頁異常的發生,提高記憶體訪問效率
  • 缺點:由於這些記憶體沒有歸還系統,在記憶體工作繁忙時,頻繁的記憶體分配和釋放會造成記憶體碎片

 

mmap()

  • 大塊記憶體(大於 128K),則直接使用記憶體映射 mmap() 來分配,也就是在文件映射段找一塊空閑記憶體分配出去
  • 缺點:分配的記憶體,會在釋放時直接歸還系統,所以每次 mmap 都會發生缺頁異常;在記憶體工作繁忙時,頻繁的記憶體分配會導致大量的缺頁異常,使內核的管理負擔增大, 這也是 malloc 只對大塊記憶體使用 mmap 的原因

 

總結

  • 當這兩種調用發生後,其實並沒有真正分配記憶體
  • 這些記憶體,都只在首次訪問時才分配,也就是通過缺頁異常進入內核中,再由內核來分配記憶體

 

Linux 使用夥伴系統來管理記憶體分配

  • 這些記憶體在 MMU 中以頁為單位進行管理,夥伴系統也一樣,以頁為單位來管理記憶體,並且會通過相鄰頁的合併,減少記憶體碎片化
  • 在用戶空間,malloc 通過 brk() 分配的記憶體,在釋放時並不立即歸還系統,而是快取起來重複利用
  • 在內核空間,Linux 則通過 slab 分配器來管理小記憶體
  • 你可以把 slab 看成構建在夥伴系統上的一個快取,主要作用就是分配並釋放內核中的小對象

 

釋放記憶體

  • 對記憶體來說,如果只分配而不釋放,就會造成記憶體泄露,甚至會耗盡系統記憶體
  • 所以,在應用程式用完記憶體後,還需要調用 free() 或 unmap() ,來釋放這些不用的記憶體

 

回收

系統不會任由某個進程用完所有記憶體,在發現記憶體緊張時,系統就會通過一系列機制來回收記憶體

  1. 回收快取:比如使用 LRU(Least Recently Used)演算法,回收最近使用最少的記憶體頁面
  2. 回收不常訪問的記憶體:把不常用的記憶體通過交換分區直接寫到磁碟中
  3. 殺死進程:記憶體緊張時系統還會通過 OOM(Out of Memory),直接殺掉佔用大量記憶體的進程

 

回收不常訪問的記憶體

  • 會用到交換分區(以下簡稱 Swap
  • Swap 其實就是把一塊磁碟空間當成記憶體來用
  • 它可以把進程暫時不用的數據存儲到磁碟中(這個過程稱為換出),當進程訪問這些記憶體時,再從磁碟讀取這些數據到記憶體中(這個過程稱為換入
  • 通常只在記憶體不足時, 才會發生 Swap 交換
  • 優點:Swap 把系統的可用記憶體變大了
  • 缺點:由於磁碟讀寫的速度遠比記憶體慢,所以 Swap 會導致嚴重的記憶體性能問題

 

OOM

是內核的一種保護機制

監控進程的記憶體使用情況,並且使用 oom_score 為每個進程的記憶體使用情況進行評分:

  • 一個進程消耗的記憶體越大,oom_score 就越大,越容易被 OOM 殺死,從而保護系統
  • 一個進程運行佔用的 CPU 越多,oom_score 就越小

 

可以通過 /proc 文件系統,手動設置進程的  oom_adj ,從而調整進程的 oom_score 

 oom_adj  的範圍是 [-17, 15] ,數值越大,表示進程越容易被 OOM 殺死;數值越小,表示進程越不容易被 OOM 殺死,其中 -17 表示禁止 OOM

 

調整 oom_score 的栗子

把 sshd 進程的 oom_adj 調小為 -16,這樣, sshd 進程就 不容易被 OOM 殺死

echo -16 > /proc/$(pidof sshd)/oom_adj 

 

如何查看記憶體使用情況

free

顯示的是整個系統的記憶體使用情況

部落格地址待更新…

 

top

可以查看系統記憶體使用情況,也可以看進程的,具體可以看下面的部落格哦

//www.cnblogs.com/poloyy/p/12552041.html