性能測試必備知識(10)- Linux 是怎麼管理內存的?

做性能測試的必備知識系列,可以看下面鏈接的文章哦

//www.cnblogs.com/poloyy/category/1806772.html

 

內存映射

日常生活常說的內存是什麼

  • 比方說,我的筆記本電腦內存就是 8GB 的
  • 這個內存其實是物理內存
  • 物理內存也稱為主存,大多數計算機用的主存都是動態隨機訪問內存(DRAM)

 

靈魂拷問

只有內核才可以直接訪問物理內存,那麼進程要訪問內存時,怎麼辦?

 

虛擬地址空間

  • 為了解決上面的問題,Linux 內核給每個進程都提供了一個獨立的虛擬地址空間,並且這個地址空間是連續
  • 這樣,進程就可以很方便地訪問內存,更確切地說是訪問虛擬內存

 

內部

  • 虛擬地址空間的內部又被分為內核空間用戶空間兩部分
  • 不同字長(單個 CPU 指令可以處理數據的最大長度)的處理器,地址空間的範圍也不同

 

最常見的 32 位和64 位系統的虛擬地址空間

  • 32 位系統的內核空間佔用 1G,位於最高處,剩下的 3G 是用戶空間
  • 而 64 位系統的內核空間和用戶空間都是 128T,分別佔據整個內存空間的最高和最低處,剩下的中間部分是未定義的

 

進程的用戶態和內核態

  • 進程在用戶態時,只能訪問用戶空間內存
  • 只有進入內核態後,才可以訪問內核空間內存
  • 雖然每個進程的地址空間都包含了內核空間,但這些內核空間,其實關聯的都是相同的物理內存
  • 這樣,進程切換到內核態後,就可以很方便地訪問內核空間內存

 

為什麼會有內存映射

  • 既然每個進程都有一個這麼大的地址空間,那麼所有進程的虛擬內存加起來,自然要比實際的物理內存大得多
  • 所以,並不是所有的虛擬內存都會分配物理內存,只有那些實際使用的虛擬內存才分配物理內存
  • 並且分配後的物理內存,是通過內存映射來管理的

 

什麼是內存映射

  • 內存映射,其實就是將虛擬內存地址映射到物理內存地址
  • 為了完成內存映射,內核為每個進程都維護了一張頁表,記錄虛擬地址與物理地址的映射關係

  • 頁表實際上存儲在 CPU 的內存管理單元 MMU
  • 正常情況下,處理器就可以直接通過硬件,找出要訪問的內存
  • 在頁表的映射下,進程就可以通過虛擬地址來訪問物理內存了

 

靈魂拷問

么具體到 一個 Linux 進程中,這些內存又是怎麼使用的呢?

 

 

虛擬內存空間分佈

回答上面的問題,需要進一步了解虛擬內存空間的分佈情況

用戶空間內存,其實又被分成了多個不同的段

這是 32 位系統,用戶空間內存,從低到高分別是五種不同的內存段

  1. 只讀段:包括代碼和常量等
  2. 數據段:包括全局變量等
  3. 堆:包括動態分配的內存,從低地址開始向上增長
  4. 文件映射段:包括動態庫、共享內存等,從高地址開始向下增長
  5. 棧:包括局部變量和函數調用的上下文等。棧的大小是固定的,一般是 8 MB

 

在這五個內存段中,堆和文件映射段的內存是動態分配

比如說,使用 C 標準庫的 malloc()  或者 mmap() ,就可以分別在堆和文件映射段動態分配內存

 

其實 64 位系統的內存分佈也類似,只不過內存空間要大得多

 

靈魂拷問

內存究竟是怎麼分配的呢?

 

內存分配與回收

分配

 malloc() 是 C 標準庫提供的內存分配函數,對應到系統調用上,有兩種實現方式,即 brk() 和 mmap() 

 

brk()

  • 對小塊內存(小於 128K),C 標準庫使用 brk() 來分配
  • 也就是通過移動堆頂的位置來分配內存
  • 這些內存釋放後並不會立刻歸還系統,而是被緩存起來,這樣就可以重複使用
  • 優點:緩存可以減少缺頁異常的發生,提高內存訪問效率
  • 缺點:由於這些內存沒有歸還系統,在內存工作繁忙時,頻繁的內存分配和釋放會造成內存碎片

 

mmap()

  • 大塊內存(大於 128K),則直接使用內存映射 mmap() 來分配,也就是在文件映射段找一塊空閑內存分配出去
  • 缺點:分配的內存,會在釋放時直接歸還系統,所以每次 mmap 都會發生缺頁異常;在內存工作繁忙時,頻繁的內存分配會導致大量的缺頁異常,使內核的管理負擔增大, 這也是 malloc 只對大塊內存使用 mmap 的原因

 

總結

  • 當這兩種調用發生後,其實並沒有真正分配內存
  • 這些內存,都只在首次訪問時才分配,也就是通過缺頁異常進入內核中,再由內核來分配內存

 

Linux 使用夥伴系統來管理內存分配

  • 這些內存在 MMU 中以頁為單位進行管理,夥伴系統也一樣,以頁為單位來管理內存,並且會通過相鄰頁的合併,減少內存碎片化
  • 在用戶空間,malloc 通過 brk() 分配的內存,在釋放時並不立即歸還系統,而是緩存起來重複利用
  • 在內核空間,Linux 則通過 slab 分配器來管理小內存
  • 你可以把 slab 看成構建在夥伴系統上的一個緩存,主要作用就是分配並釋放內核中的小對象

 

釋放內存

  • 對內存來說,如果只分配而不釋放,就會造成內存泄露,甚至會耗盡系統內存
  • 所以,在應用程序用完內存後,還需要調用 free() 或 unmap() ,來釋放這些不用的內存

 

回收

系統不會任由某個進程用完所有內存,在發現內存緊張時,系統就會通過一系列機制來回收內存

  1. 回收緩存:比如使用 LRU(Least Recently Used)算法,回收最近使用最少的內存頁面
  2. 回收不常訪問的內存:把不常用的內存通過交換分區直接寫到磁盤中
  3. 殺死進程:內存緊張時系統還會通過 OOM(Out of Memory),直接殺掉佔用大量內存的進程

 

回收不常訪問的內存

  • 會用到交換分區(以下簡稱 Swap
  • Swap 其實就是把一塊磁盤空間當成內存來用
  • 它可以把進程暫時不用的數據存儲到磁盤中(這個過程稱為換出),當進程訪問這些內存時,再從磁盤讀取這些數據到內存中(這個過程稱為換入
  • 通常只在內存不足時, 才會發生 Swap 交換
  • 優點:Swap 把系統的可用內存變大了
  • 缺點:由於磁盤讀寫的速度遠比內存慢,所以 Swap 會導致嚴重的內存性能問題

 

OOM

是內核的一種保護機制

監控進程的內存使用情況,並且使用 oom_score 為每個進程的內存使用情況進行評分:

  • 一個進程消耗的內存越大,oom_score 就越大,越容易被 OOM 殺死,從而保護系統
  • 一個進程運行佔用的 CPU 越多,oom_score 就越小

 

可以通過 /proc 文件系統,手動設置進程的  oom_adj ,從而調整進程的 oom_score 

 oom_adj  的範圍是 [-17, 15] ,數值越大,表示進程越容易被 OOM 殺死;數值越小,表示進程越不容易被 OOM 殺死,其中 -17 表示禁止 OOM

 

調整 oom_score 的栗子

把 sshd 進程的 oom_adj 調小為 -16,這樣, sshd 進程就 不容易被 OOM 殺死

echo -16 > /proc/$(pidof sshd)/oom_adj 

 

如何查看內存使用情況

free

顯示的是整個系統的內存使用情況

博客地址待更新…

 

top

可以查看系統內存使用情況,也可以看進程的,具體可以看下面的博客哦

//www.cnblogs.com/poloyy/p/12552041.html