jvm之棧、堆

1. Java Virtual Machine

​ 人群當中,一位叫java的小夥子正向周圍一眾人群細數著自己取得的榮耀與輝煌。就在此時,c老頭和c++老頭緩步走來,看著被眾人圍住的java,c老頭感嘆地對著身旁的c++說道:「原以為你就可以挑起我的梁子一直走下去的。」
​ c++笑著回應道:「江山代有才人出,這世界以後總會是90後甚至00後的天下!」
察覺到c和c++的java連忙走出人群,說道:「兩位前輩謙虛了,這世界可還離不開兩位前輩,我只不過是站在了兩位前輩的肩上罷了。」
​ 「你這小子可是解決了我們不少的問題啊,像指針、多繼承、記憶體管理……那時,可是有很多程式設計師對我們抱怨頗深!」c++誇讚道。
​ 「還有Java Virtual Machine,真的是一個不錯的想法!」一旁的c補充道。
……
Java虛擬機,一直都是都是我們在學習Java的過程中反覆提及的一個東西,那麼JVM具體是怎樣的呢?請看下圖:

2jvm.png

​ 簡單說來,JVM的工作就是通過類載入系統將位元組碼文件載入到記憶體當中去,載入到記憶體當中的數據,就從邏輯上形成了我們看到的圖中的運行時數據區(記憶體模型),

隨後執行引擎操作/調度記憶體模型中數據執行程式。

​ 現在看到記憶體模型裡面的東西,大家是否有些眼熟呢?現在回想起自己面試時,遇到的JVM面試題是不是全是關於記憶體模型裡面的東西。比如:棧、堆、Eden、Survivor、GC等等。

2. 舉個小栗子

public class Example{
	public int add(){
		int a = 3;
		int b = 4;
		int c = a + b;
		return c;
	}
	public static void main(String[] args){
		Example e1 = new Example();
		e1.add();
		//.......
	}
	//......
}

​ 這個栗子是在幹啥,不用多說吧!今天我們就要來慢慢地剝開它,以往剝開吃得太快就沒有什麼感覺了。

3. 棧

​ 棧,全稱為Java 虛擬機棧,執行緒私有,生命周期和執行緒一致。描述的是 Java 方法執行的記憶體模型:每個方法在執行時都會床創建一個棧幀(Stack Frame)用於存儲局部變數表操作數棧動態鏈接方法出口等資訊。每一個方法從調用直至執行結束,就對應著一個棧幀從虛擬機棧中入棧到出棧的過程。

​ 怎樣解釋上面的話呢?那就需要開始剝栗子了!刀來(大喝一聲)!

​ 當栗子開始執行時,由於只有一個main執行緒,因而JVM只需要為main執行緒分配好棧區的記憶體(話句話說如果有多個執行緒,自然就會有多個棧區,並且為各自執行緒私有)。OK! main繼續執行,就會遇到main()方法,遇到之後呢!JVM又會在棧區當中再划出一個小塊來存放main()方法執行過程的數據,這一小塊區域也就是棧幀。main()方法執行過程中又有一個add()方法出現了,同樣地,JVM又會再為add()分配一個棧幀,同時壓入到棧區,以後再遇到其他方法也是如此。當然,方法在執行完成之後,便會彈出並釋放記憶體,當執行緒中棧區的所有方法都返回之後,程式也就算是執行完畢了。

​ 那麼棧幀又是何許物業?咦,我刀呢?算了,手撕吧。

​ 當我們扯開棧區,撕開棧幀,一不小心,局部變數表、操作數棧、動態鏈接、方法出口……嘩啦啦地散落一地。

3zz.png

​ 撿起add()棧幀的局部變數表和操作數棧就可以看到這樣一個畫面,在執行栗子中add()方法中的三行程式碼時,局部變數表和操作數棧的一個變化過程:首先,執行int a = 3;局部變數表中會分配出一個int區域,表示為a;同時iconst命令使得操作數棧中壓入了常量3,然後再由istore命令將3彈出,賦值給局部變數表中a。同樣,int b = 4; 這一行程式碼也是如此。然後,int c = a + b;從右往左開始,先執行a + b,也就是iload命令從局部變數中取出a、b對應的值,再將iadd後的值push進操作數棧中,剩下的便是int c = 7的操作了。

​ 通過上面的栗子,就很容易明白;局部變數表,顧名思義就是存放每個方法中的局部變數(即編譯器可知的各種基本類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference 類型)和 returnAddress 類型(指向了一條位元組碼指令的地址))所在處,如圖中的a、b。操作數棧,也就是存放的就是方法當中的各種操作數的臨時空間,又如栗子中的3、4。

​ 動態鏈接:Class文件的常量池中存在有大量的符號引用,位元組碼中的方法調用指令就以指向常量池的引用作為參數,而將部分符號引用在運行期間轉化為直接引用,這種轉化即為動態鏈接。這個解釋當中會涉及到許多概念,比如常量池、符號引用等,要想理解這些概念,就需要去了解class文件的結構,內容太多就不在這裡詳細描述了。

​ 方法出口:簡單來說,就是用於標記當前方法執行完成之後,應該返回到下一條指令執行位置。比如就上面的栗子而言,add()在執行完畢之後,就應該返回到e1.add()之後繼續執行main()後面的程式碼。

4. 堆

​ 對於絕大多數應用來說,這塊區域是 JVM 所管理的記憶體中最大的一塊。執行緒共享,主要是用於存放對象實例和數組。除此之外,堆區還涉及到JVM中一個非常重要的工作–GC(Garbage Collection)。

4dui.png

​ 從圖中就可以看出棧和堆之間的關係,對於new的對象,棧中局部變數表只會存放在堆中的地址引用,具體實例變數的空間分配都在堆中。

​ 而堆中的記憶體區域又會劃分為年輕代和老年代兩部分,其中一般情況下年輕代佔1/3記憶體,老年代佔2/3記憶體;年輕代又被劃分為Eden區(伊甸園區)和兩個Survivor區(倖存區),各自分別占年輕代空間的8/10、/1/10、1/10。也就是說如果堆記憶體區域有600M,那麼年輕代200M、老年代400M、Eden區160M、S0區20M、S1區20M。

​ 這樣劃分區域的目的是什麼呢?這個回答就關係到JVM的GC機制了。

​ 首先,程式一開始,所有的實例對象都會生成在Eden區中,當Eden區滿了的時候,這時就會觸發minor gc,jvm使用gc roots的查找方式將垃圾對象移動(複製演算法)到S0區域中去,並且將Eden區中的其他對象視為垃圾對象,清空Eden區。

​ 當實例對象再次充滿Eden區時,又會觸發minor gc;但是這次是將Eden區S0區中的所有非垃圾對象移動到S1中,並清空Eden區和S0區;同樣下次minor gc時,就是將Eden區和S1區中的非垃圾對象轉移到S0中……當然,這個左手倒右手過程並不是無休止的。在反覆minor gc的過程中,每個對象身上還有一個叫做分代年齡的屬性,每次minor gc對象的分代年齡就會加1,當達到15(默認情況)時,這個對象就會被放到老年代中去,成為長期存在的對象。除此之外,還有一種情況,即是當從Eden區複製內容到Survivor區時,複製內容大小超過S0或S1任一區域一半大小,也會直接被放入到老年代中,所以老年代才會需要那麼大的區域,不然怎麼抗得住這些年輕人這樣搞~~。

​ 雖然老年代空間很大,但總會有滿了的時候,這時麻煩的事情就出現了——full gc。在full gc時,jvm會先觸發STW(Stop-The-World),也就是暫停其他所有的java進程,回收整個記憶體模型當中的記憶體資源,從而造成用戶響應超時或者是系統無響應,這對於並發程式比較高的系統(比如秒殺活動)影響程度是極其之大的。

通過gc機制,我們就可以得出一個簡單有效的JVM優化辦法,那就是減少full gc的次數,如何減少呢?只需要調整老年代和年輕代的記憶體空間分配使得在minor gc的過程中儘可能的消除大部分的垃圾對象。比如這種java -Xmx3072 -Xms3072M -Xmn2048M -Xss1M

​ -Xmx3072M:設置JVM最大可用記憶體為3072M。
​ -Xms3072M:設置JVM初始記憶體為3072M。此值可以設置與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配記憶體。
​ -Xmn2048M:設置年輕代大小為2G。增大年輕代後,將會減小年老代大小。不過此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8。
​ -Xss1M:設置每個執行緒的堆棧大小。JDK5.0以後每個執行緒堆棧大小為1M,以前每個執行緒堆棧大小為256K。更具應用的執行緒所需記憶體大小進行調整。在相同物理記憶體下,減小這個值能生成更多的執行緒。

GC Roots:在上面的gc過程中,我們還提到了JVM是如何判斷垃圾對象的。簡單地來說,就是從gc roots的根出發(即局部變數表中的引用對象),一路沿著引用關係找,凡是能夠被找到的對象都是非垃圾對象,並且會被移動到下一個它應該去的區域中。剩下的對象,會在區域清空時,一同被清理掉而無須關心。

5. 小結

​ 除了棧、堆之外,還有程式計數器、方法區(元空間)、本地方法棧,這些相對比較容易理解。

​ 程式計數器:用來記錄當前指令執行完成後下一條指令的位置,由執行引擎來完成相應的修改操作。

​ 方法區(元空間):存放常量、靜態變數、類資訊等。

​ 本地方法棧:與java虛擬機棧類似,不過存放的是native方法執行時的局部變數等數據存放位置。因為native方法一般不是由java語言編寫的,常見的就是.dll文件當中的方法(由C/C++編寫),比如 Thread類中start()方法在運行時就會調用到一個start0()方法,查看源碼時就會看到private native void start0();這個方法就是一個本地方法。本地方法的作用就相當於是一個「介面」,用來連接java和其他語言的介面。

​ 另外,對於new出來的對象,無論是在棧的局部變數表還是在方法區中的空間中,存放的都只是對象在中的地址(引用),具體的空間分配是在堆中。


公眾號:良許Linux

有收穫?希望老鐵們來個三連擊,給更多的人看到這篇文章