JVM運行時數據區域詳解
參考文章:
- 《Java Se11 虛擬機規範》
- 《深入理解Java虛擬機-JVM高級特性與最佳實踐 第3版》- 周志明
本文基於Java Se 11講解。
根據《Java虛擬機規範》的規定,Java虛擬機所管理的記憶體將會包括以下幾個運行時數據區域:
對於不同的虛擬機實現,在運行時數據區的實現上並不完全相同。對於常用的HotSpot虛擬機來說,它的運行時數據區如下:
主要區別在於,HotSpot使用了直接使用本地記憶體(即機器本身記憶體)的元空間(metaspace)來實現方法區。
下面針對每個具體的數據區域進行詳細的介紹。
1. 程式計數器
程式計數器(Program Counter Register)是一塊較小的記憶體空間,它可以看作是當前執行緒所執行的位元組碼的行號指示器。
JVM可以同時支援多個執行執行緒。每個Java虛擬機執行緒都有自己的pc(程式計數器)暫存器。在任何時候,每個Java虛擬機執行緒都在執行單個方法的程式碼,即該執行緒的當前方法。如果該方法不是native方法,則pc暫存器包含當前正在執行的Java虛擬機指令的地址。如果執行緒當前正在執行的方法是native的,則pc暫存器的值為undefined
。Java虛擬機的pc暫存器足夠寬,可以容納特定平台上的returnAddress
或native指針。
此記憶體區域是唯一一個在《Java虛擬機規範》中沒有規定任何OutOfMemoryError
情況的區域。
2. Java虛擬機棧
與程式計數器一樣,是執行緒私有的,生命周期與執行緒相同。虛擬機棧描述的是Java方法執行的執行緒記憶體模型。
「虛擬機棧」裡面的每條數據就是「棧幀」,在 Java 方法執行的時候則創建一個「棧幀」併入棧「虛擬機棧」。調用結束則「棧幀」出棧。
每個棧幀包含四個區域:
- 局部變數表:存儲了方法執行過程中需要用到的所有局部變數
- 操作數棧:暫存變數,通過變數的入棧、出棧等操作來執行計算
- 動態連接:翻譯符號引用為直接引用,即把一個字面量翻譯為運行時的一個地址引用
- 返回地址
每個執行緒擁有一個「虛擬機棧」,每個「虛擬機棧」擁有多個「棧幀」,而棧幀則對應著一個方法。每個「棧幀」包含局部變數表、操作數棧、動態鏈接、方法返回地址。方法運行結束則意味著該「棧幀」出棧。
在《Java虛擬機規範》中,對這個記憶體區域規定了兩類異常狀況:
- 如果執行緒請求的棧深度大於虛擬機所允許的深度,將拋出
StackOverflowError
異常; - 如果Java虛擬機棧容量可以動態擴展(HotSpot虛擬機的棧容量不能動態擴展),當棧嘗試擴展時無法申請到足夠的記憶體,或為一個新執行緒初始化JVM棧時沒有足夠的記憶體時會拋出
OutOfMemoryError
異常。
3. 本地方法棧
本地方法棧(Native Method Stacks)與虛擬機棧所發揮的作用是非常相似的,其區別只是虛擬機棧為虛擬機執行Java方法(也就是位元組碼)服務,而本地方法棧則是為虛擬機使用到的本地(Native)方法服務。
《Java虛擬機規範》對本地方法棧中方法使用的語言、使用方式與數據結構並沒有任何強制規定,因此具體的虛擬機可以根據需要自由實現它,甚至有的Java虛擬機(譬如Hot-Spot虛擬機)直接就把本地方法棧和虛擬機棧合二為一。與虛擬機棧一樣,本地方法棧也會在棧深度溢出或者棧擴展失敗時分別拋出StackOverflowError
和OutOfMemoryError
異常。
4. Java堆
所有執行緒共享,虛擬機啟動時創建。唯一的目的是用於存放對象實例和數組,絕大部分對象實例在堆上分配記憶體。
在 Java 中,數組也是對象。
現代垃圾收集器大部分基於分代收集理論設計。「新生代」、「老年代」這些名詞僅僅是一部分GC的設計風格,而不是《Java虛擬機規範》定義的。而從G1收集器出現之後,出現了不採用分代設計的新垃圾收集器。
JDK8之後Class對象、static
變數、字元串常量池都放在堆里。
static
變數作為類的資訊,存儲在Class對象里。
Java 的對象可以分為基本數據類型和普通對象。普通對象會在堆上分配。對於基本數據類型,如果是局部變數,則會在棧上分配。其他情況,通常在在堆上分配,逃逸分析的情況下可能會在棧分配。
如果在Java堆中沒有記憶體完成實例分配,並且堆也無法再擴展時,Java虛擬機將會拋出OutOfMemoryError
異常。
4.1 字元串常量池
字元串常量池是由String
類維護的一個字元串池。是一種池化思想的實現,是為了節省重複創建字元串對象的性能開銷和記憶體空間。
每當程式碼創建字元串常量時,JVM會首先檢查字元串常量池。如果字元串已經存在池中,就返回池中的實例引用。如果字元串不在池中,就會實例化一個字元串並放到池中。Java能夠進行這樣的優化是因為字元串是不可變的,可以不用擔心數據衝突進行共享。
字元串常量池從JDK7開始挪到了堆中。
可以通過調用String.intern()
方法把一個字元串對象放到字元串常量池中。如果池中已經存在相等的對象,則會返回已存在對象的引用;否則會把這個字元串對象加入到池中,並返回新加入的字元串對象的引用。
String s = new String("hello")
會創建幾個對象?
如果字元串常量池中沒有”hello”,則生成2個,否則只生成一個。
String s = new String("abc"); System.out.println((s.intern() == s));
列印結果是什麼?
列印結果為false。s
指向的是堆中的對象,s.intern()
返回的是字元串常量池中的對象的引用。
4.2 字面量和常量
字面量(literal) :用於表達源碼中的一個固定值的符號(notation)。如整數、浮點數及字元串等。如1
、0x01
是整數字面量,Hello World
是字元串字面量。
常量:在java中,final
修飾的變數也可以被稱為是常量。任何具有不變性的東西都可以稱為常量。如String
對象是常量。
對象池:是Java語言層面實現的,如Integer.valueOf()
(Integer i = 10
也會調該方法)會使用IntegerCache
的快取對象。如果使用new Integer(10)
則不會使用對象池中的實例。
字元串常量池:類似於對象池,但它是JVM層面的技術。字元串常量池的實現是c++實現的StringTable
,實際上是一個固定容量的Hashtable
,每一個bucket包含一系列相同hash碼的字元串。
5. 方法區
用於存儲被JVM載入的class的元數據資訊,比如類的結構、運行時的常量池、欄位、常量、方法數據、方法構造函數以及介面初始化等特殊方法。還有JIT編譯器編譯後的程式碼快取等數據。
JDK8之前,HotSpot採用永久代的概念實現方法區,JDK8開始廢棄了永久代的概念,改用在本地記憶體(Native Memory)中實現的元空間(Meta-space)來代替。
方法區的GC比較少出現,回收目標主要是針對常量池的回收和對類型的卸載。
根據《Java虛擬機規範》的規定,如果方法區無法滿足新的記憶體分配需求時,將拋出OutOfMemoryError
異常。
5.1 運行時常量池
運行時常量池(Runtime Constant Pool)是方法區的一部分。Class文件中除了有類的版本、欄位、方法、介面等描述資訊外,還有一項資訊是常量池表(Constant Pool Table),用於存放編譯期生成的各種字面量與符號引用,這部分內容將在類載入後存放到方法區的運行時常量池中。
一般來說,除了保存Class文件中描述的符號引用外,還會把由符號引用翻譯出來的直接引用也存儲在運行時常量池中。
既然運行時常量池是方法區的一部分,自然受到方法區記憶體的限制,當常量池無法再申請到記憶體時會拋出OutOfMemoryError
異常。