jvm之棧、堆

2020 年 7 月 9 日
筆記

1. Java Virtual Machine

人群當中，一位叫java的小夥子正向周圍一眾人群細數著自己取得的榮耀與輝煌。就在此時，c老頭和c++老頭緩步走來，看著被眾人圍住的java，c老頭感嘆地對著身旁的c++說道：「原以為你就可以挑起我的梁子一直走下去的。」
c++笑著回應道：「江山代有才人出，這世界以後總會是90後甚至00後的天下！」
察覺到c和c++的java連忙走出人群，說道：「兩位前輩謙虛了，這世界可還離不開兩位前輩，我只不過是站在了兩位前輩的肩上罷了。」
「你這小子可是解決了我們不少的問題啊，像指針、多繼承、記憶體管理……那時，可是有很多程式設計師對我們抱怨頗深！」c++誇讚道。
「還有Java Virtual Machine，真的是一個不錯的想法!」一旁的c補充道。
……
Java虛擬機，一直都是都是我們在學習Java的過程中反覆提及的一個東西，那麼JVM具體是怎樣的呢？請看下圖：

簡單說來，JVM的工作就是通過類載入系統將位元組碼文件載入到記憶體當中去，載入到記憶體當中的數據，就從邏輯上形成了我們看到的圖中的運行時數據區（記憶體模型），

隨後執行引擎操作/調度記憶體模型中數據執行程式。

現在看到記憶體模型裡面的東西，大家是否有些眼熟呢？現在回想起自己面試時，遇到的JVM面試題是不是全是關於記憶體模型裡面的東西。比如：棧、堆、Eden、Survivor、GC等等。

2. 舉個小栗子

public class Example{
	public int add(){
		int a = 3;
		int b = 4;
		int c = a + b;
		return c;
	}
	public static void main(String[] args){
		Example e1 = new Example();
		e1.add();
		//.......
	}
	//......
}

這個栗子是在幹啥，不用多說吧！今天我們就要來慢慢地剝開它，以往剝開吃得太快就沒有什麼感覺了。

3. 棧

棧，全稱為Java 虛擬機棧，執行緒私有，生命周期和執行緒一致。描述的是 Java 方法執行的記憶體模型：每個方法在執行時都會床創建一個棧幀(Stack Frame)用於存儲局部變數表、操作數棧、動態鏈接、方法出口等資訊。每一個方法從調用直至執行結束，就對應著一個棧幀從虛擬機棧中入棧到出棧的過程。

怎樣解釋上面的話呢？那就需要開始剝栗子了！刀來（大喝一聲）！

當栗子開始執行時，由於只有一個main執行緒，因而JVM只需要為main執行緒分配好棧區的記憶體（話句話說如果有多個執行緒，自然就會有多個棧區，並且為各自執行緒私有）。OK! main繼續執行，就會遇到main()方法，遇到之後呢!JVM又會在棧區當中再划出一個小塊來存放main()方法執行過程的數據，這一小塊區域也就是棧幀。main()方法執行過程中又有一個add()方法出現了，同樣地，JVM又會再為add()分配一個棧幀，同時壓入到棧區，以後再遇到其他方法也是如此。當然，方法在執行完成之後，便會彈出並釋放記憶體，當執行緒中棧區的所有方法都返回之後，程式也就算是執行完畢了。

那麼棧幀又是何許物業？咦，我刀呢？算了，手撕吧。

當我們扯開棧區，撕開棧幀，一不小心，局部變數表、操作數棧、動態鏈接、方法出口……嘩啦啦地散落一地。

撿起add()棧幀的局部變數表和操作數棧就可以看到這樣一個畫面，在執行栗子中add()方法中的三行程式碼時，局部變數表和操作數棧的一個變化過程：首先，執行int a = 3;局部變數表中會分配出一個int區域，表示為a；同時iconst命令使得操作數棧中壓入了常量3，然後再由istore命令將3彈出，賦值給局部變數表中a。同樣，int b = 4; 這一行程式碼也是如此。然後，int c = a + b;從右往左開始，先執行a + b，也就是iload命令從局部變數中取出a、b對應的值，再將iadd後的值push進操作數棧中，剩下的便是int c = 7的操作了。

通過上面的栗子，就很容易明白；局部變數表，顧名思義就是存放每個方法中的局部變數（即編譯器可知的各種基本類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference 類型)和 returnAddress 類型(指向了一條位元組碼指令的地址)）所在處，如圖中的a、b。操作數棧，也就是存放的就是方法當中的各種操作數的臨時空間，又如栗子中的3、4。

動態鏈接：Class文件的常量池中存在有大量的符號引用,位元組碼中的方法調用指令就以指向常量池的引用作為參數，而將部分符號引用在運行期間轉化為直接引用,這種轉化即為動態鏈接。這個解釋當中會涉及到許多概念，比如常量池、符號引用等，要想理解這些概念，就需要去了解class文件的結構，內容太多就不在這裡詳細描述了。

方法出口：簡單來說，就是用於標記當前方法執行完成之後，應該返回到下一條指令執行位置。比如就上面的栗子而言，add()在執行完畢之後，就應該返回到e1.add()之後繼續執行main()後面的程式碼。

4. 堆

對於絕大多數應用來說，這塊區域是 JVM 所管理的記憶體中最大的一塊。執行緒共享，主要是用於存放對象實例和數組。除此之外，堆區還涉及到JVM中一個非常重要的工作–GC（Garbage Collection）。

從圖中就可以看出棧和堆之間的關係，對於new的對象，棧中局部變數表只會存放在堆中的地址引用，具體實例變數的空間分配都在堆中。

而堆中的記憶體區域又會劃分為年輕代和老年代兩部分，其中一般情況下年輕代佔1/3記憶體，老年代佔2/3記憶體；年輕代又被劃分為Eden區（伊甸園區）和兩個Survivor區（倖存區），各自分別占年輕代空間的8/10、/1/10、1/10。也就是說如果堆記憶體區域有600M，那麼年輕代200M、老年代400M、Eden區160M、S0區20M、S1區20M。

這樣劃分區域的目的是什麼呢？這個回答就關係到JVM的GC機制了。

首先，程式一開始，所有的實例對象都會生成在Eden區中，當Eden區滿了的時候，這時就會觸發minor gc，jvm使用gc roots的查找方式將非垃圾對象移動（複製演算法）到S0區域中去，並且將Eden區中的其他對象視為垃圾對象，清空Eden區。

當實例對象再次充滿Eden區時，又會觸發minor gc；但是這次是將Eden區和S0區中的所有非垃圾對象移動到S1中，並清空Eden區和S0區；同樣下次minor gc時，就是將Eden區和S1區中的非垃圾對象轉移到S0中……當然，這個左手倒右手過程並不是無休止的。在反覆minor gc的過程中，每個對象身上還有一個叫做分代年齡的屬性，每次minor gc對象的分代年齡就會加1，當達到15（默認情況）時，這個對象就會被放到老年代中去，成為長期存在的對象。除此之外，還有一種情況，即是當從Eden區複製內容到Survivor區時，複製內容大小超過S0或S1任一區域一半大小，也會直接被放入到老年代中，所以老年代才會需要那麼大的區域，不然怎麼抗得住這些年輕人這樣搞~~。

雖然老年代空間很大，但總會有滿了的時候，這時麻煩的事情就出現了——full gc。在full gc時，jvm會先觸發STW（Stop-The-World），也就是暫停其他所有的java進程，回收整個記憶體模型當中的記憶體資源，從而造成用戶響應超時或者是系統無響應，這對於並發程式比較高的系統（比如秒殺活動）影響程度是極其之大的。

通過gc機制，我們就可以得出一個簡單有效的JVM優化辦法，那就是減少full gc的次數，如何減少呢？只需要調整老年代和年輕代的記憶體空間分配使得在minor gc的過程中儘可能的消除大部分的垃圾對象。比如這種java -Xmx3072 -Xms3072M -Xmn2048M -Xss1M

-Xmx3072M：設置JVM最大可用記憶體為3072M。
-Xms3072M：設置JVM初始記憶體為3072M。此值可以設置與-Xmx相同，以避免每次垃圾回收完成後JVM重新分配記憶體。
-Xmn2048M：設置年輕代大小為2G。增大年輕代後，將會減小年老代大小。不過此值對系統性能影響較大，Sun官方推薦配置為整個堆的3/8。
-Xss1M：設置每個執行緒的堆棧大小。JDK5.0以後每個執行緒堆棧大小為1M，以前每個執行緒堆棧大小為256K。更具應用的執行緒所需記憶體大小進行調整。在相同物理記憶體下，減小這個值能生成更多的執行緒。

GC Roots：在上面的gc過程中，我們還提到了JVM是如何判斷垃圾對象的。簡單地來說，就是從gc roots的根出發（即局部變數表中的引用對象），一路沿著引用關係找，凡是能夠被找到的對象都是非垃圾對象，並且會被移動到下一個它應該去的區域中。剩下的對象，會在區域清空時，一同被清理掉而無須關心。

5. 小結

除了棧、堆之外，還有程式計數器、方法區（元空間）、本地方法棧，這些相對比較容易理解。

程式計數器：用來記錄當前指令執行完成後下一條指令的位置，由執行引擎來完成相應的修改操作。

方法區（元空間）：存放常量、靜態變數、類資訊等。

本地方法棧：與java虛擬機棧類似，不過存放的是native方法執行時的局部變數等數據存放位置。因為native方法一般不是由java語言編寫的，常見的就是.dll文件當中的方法（由C/C++編寫），比如 Thread類中start()方法在運行時就會調用到一個start0()方法，查看源碼時就會看到private native void start0();這個方法就是一個本地方法。本地方法的作用就相當於是一個「介面」，用來連接java和其他語言的介面。

另外，對於new出來的對象，無論是在棧的局部變數表還是在方法區中的空間中，存放的都只是對象在堆中的地址（引用），具體的空間分配是在堆中。

公眾號：良許Linux

jvm之棧、堆

1. Java Virtual Machine

2. 舉個小栗子

3. 棧

4. 堆

5. 小結

有收穫？希望老鐵們來個三連擊，給更多的人看到這篇文章

VirMach 便宜 VPS

QNews

jvm之棧、堆

1. Java Virtual Machine

2. 舉個小栗子

3. 棧

4. 堆

5. 小結

有收穫？希望老鐵們來個三連擊，給更多的人看到這篇文章

分享此文：

Related Posts

C++的編程指南

Asp.NET Core 限流控制-AspNetCoreRateLimit

Flutter 1.17 新 Material motion 規範的預構建動畫

哈薩克爆發不明肺炎 死亡率遠高於新冠

VirMach 便宜 VPS

QNews

熱門搜尋

哈薩克爆發不明肺炎死亡率遠高於新冠