Java JVM——5.Java虛擬機棧

虛擬機棧概述

  由於跨平台性的設計,Java 的指令都是根據棧來設計的。不同平台CPU架構不同,所以不能設計為基於寄存器的。 棧實現的優點是跨平台,指令集小,編譯器容易實現,缺點是性能下降,實現同樣的功能需要更多的指令。

  有不少Java開發人員一提到Java內存結構,就會非常粗略度地將JVM中的內存區理解為僅有Java堆(heap)和Java棧(stack),這種劃分方式直接繼承自傳統的C、C++程序的內存布局結構,在Java語言里就顯得有些粗糙了,實際的內存區域劃分要比這更複雜。

首先我們要明確:

  棧是運行時的單位,而堆是存儲的單位。

    ☆棧解決程序的運行問題,即程序如何執行,或者說如何處理數據。

    ☆堆解決的是數據存儲的問題,即數據怎麼放,放哪裡。

Java虛擬機棧是什麼

  Java虛擬機棧(Java Virtual Machine Stack),早期也叫Java棧。每個線程在創建時都會創建一個虛擬機棧,其內部保存一個個的棧幀(Stack Frame),對應着一次次的Java方法調用。

  棧幀(Stack Frame)用於存儲局部變量表、操作數棧、動態連接、方法返回地址等信息。每一個方法被調用直至執行完畢的過程就對應着一個棧幀在虛擬機棧中從入棧到出棧的過程。

生命周期

  與程序計數器一樣Java虛擬機棧(Java Virtual Machine Stack)也是線程私有的,它的生命周期與線程相同。

作用

  主管Java程序的運行,它保存方法的局部變量、部分結果,並參與方法的調用和返回。

局部變量,它是相比於成員變量來說的(或屬性)。

基本數據類型變量 VS 引用類型變量(類、數組、接口)。

棧的特點

  棧是一種快速有效的分配存儲方式,訪問速度僅次於程序計數器。JVM直接對Java棧的操作只有兩個:

    ① 每個方法執行,伴隨着進棧(入棧、壓棧)。
    ② 執行結束後的出棧工作。

  對於棧來說不存在垃圾回收問題(棧存在溢出的情況)。

 虛擬機棧

關於棧的異常

  Java 虛擬機規範允許Java棧的大小是動態的或者是固定不變的。

  如果採用固定大小的Java虛擬機棧,那每一個線程的Java虛擬機棧容量可以在線程創建的時候獨立選定。如果線程請求分配的棧容量超過Java虛擬機棧允許的最大容量,Java虛擬機將會拋出一個 StackOverflowError異常(棧溢出)。

  如果Java虛擬機棧可以動態擴展,並且在嘗試擴展的時候無法申請到足夠的內存,或者在創建新的線程時沒有足夠的內存去創建對應的虛擬機棧,那Java虛擬機將會拋出一個 outOfMemoryError異常(內存溢出)。

我們可以測試一下:

public class StackErrorTest {
    private static int count = 1;
    public static void main(String[] args) {
        System.out.println(count++);
        main(args);
    }
}

運行結果:

  當棧深度達到15419的時候,就出現棧內存空間不足。

設置棧內存大小 

  我們可以使用參數 -Xss選項來設置線程的最大棧空間,棧的大小直接決定了函數調用的最大可達深度。

示例:

  ✔設置棧的大小為1MB:-Xss1m。

  ✔設置棧的大小為1KB:-Xss1k。

Eclise 中,對當前類設置棧內存大小:

  代碼區域點擊右鍵 –> Run As — >RunConfigurations –> 左邊選擇要設置的類 –> 右邊點擊Arguments選項 –> VM arguments參數設置 –> 然後Apply –> Run。

  作用域:只對這個工程起作用。

Eclipse 中,對全局設置棧內存大小:

  菜單欄Window –> preference –> Java –> Installed JREs –> 選擇當前所用包 –> Edit –> Default VM Arguments參數設置 –> Finish。

  作用域:對所有工程都起作用。

棧的存儲單位

  每個線程都有自己的棧,棧中的數據都是以棧幀(Stack Frame)的格式存在。

  一個線程上正在執行的每個方法都各自對應一個棧幀(Stack Frame)。

  棧幀是一個內存區塊,是一個數據集,維繫着方法執行過程中的各種數據信息。

棧中存儲什麼?

  每個線程都有自己的棧,棧中的數據都是以棧幀(Stack Frame)的格式存在。在這個線程上正在執行的每個方法都各自對應一個棧幀(Stack Frame)。棧幀是一個內存區塊,是一個數據集,維繫着方法執行過程中的各種數據信息。

  JVM直接對Java棧的操作只有兩個,就是對棧幀的壓棧和出棧,遵循「先進後出」/「後進先出」原則。

  在一條活動線程中,一個時間點上,只會有一個活動的棧幀。即只有當前正在執行的方法的棧幀(棧頂棧幀)是有效的,這個棧幀被稱為當前棧幀(Current Frame),與當前棧幀相對應的方法就是當前方法(Current Method),定義這個方法的類就是當前類(Current Class)。

  執行引擎運行的所有位元組碼指令只針對當前棧幀進行操作。

  如果在該方法中調用了其他方法,對應的新的棧幀會被創建出來,放在棧的頂端,成為新的當前幀。

棧的運行原理

  不同線程中所包含的棧幀是不允許存在相互引用的,即不可能在一個棧幀之中引用另外一個線程的棧幀。

  如果當前方法調用了其他方法,方法返回之際,當前棧幀會傳回此方法的執行結果給前一個棧幀,接着,虛擬機會丟棄當前棧幀,使得前一個棧幀重新成為當前棧幀。

  Java方法有兩種返回函數的方式,一種是正常的函數返回,使用return指令;另外一種是拋出異常。不管使用哪種方式,都會導致棧幀被彈出。

棧的內存結構

每個棧幀中存儲着:

  ▶ 局部變量表(Local Variables)

  ▶ 操作數棧(operand Stack)(或表達式棧)

  ▶ 動態鏈接(DynamicLinking)(或指向運行時常量池的方法引用)

  ▶ 方法返回地址(Return Address)(或方法正常退出或者異常退出的定義)

  ▶ 一些附加信息

  並行每個線程下的棧都是私有的,因此每個線程都有自己各自的棧,並且每個棧裏面都有很多棧幀,棧幀的大小主要由局部變量表 和 操作數棧決定。

局部變量表

  局部變量表(Local Variables),被稱之為局部變量數組或本地變量表。

  定義為一個數字數組,主要用於存儲方法參數和定義在方法體內的局部變量這些數據類型包括各類基本數據類型、對象引用(reference),以及returnAddress類型。

  由於局部變量表是建立在線程的棧上,是線程的私有數據,因此不存在數據安全問題。

  局部變量表所需的容量大小是在編譯期確定下來的,並保存在方法的Code屬性的maximum local variables數據項中。在方法運行期間是不會改變局部變量表的大小的。

  方法嵌套調用的次數由棧的大小決定。一般來說,棧越大,方法嵌套調用次數越多。對一個函數而言,它的參數和局部變量越多,使得局部變量表膨脹,它的棧幀就越大,以滿足方法調用所需傳遞的信息增大的需求。進而函數調用就會佔用更多的棧空間,導致其嵌套調用次數就會減少。

  局部變量表中的變量只在當前方法調用中有效。在方法執行時,虛擬機通過使用局部變量表完成參數值到參數變量列表的傳遞過程。當方法調用結束後,隨着方法棧幀的銷毀,局部變量表也會隨之銷毀。

變量槽(Slot)

  參數值的存放總是在局部變量數組的index 0開始,到數組長度-1的索引結束。

  局部變量表最基本的存儲單元是Slot(變量槽),局部變量表中存放編譯期可知的各種基本數據類型(8種),引用類型(reference),returnAddress類型的變量。

  在局部變量表裡,32位以內的類型只佔用一個slot(包括returnAddress類型),64位的類型(long和double)佔用兩個slot。

  byte、short、char 在存儲前被轉換為int,boolean也被轉換為int,0表示false,非0表示true。long和double則佔據兩個slot。

  JVM會為局部變量表中的每一個Slot都分配一個訪問索引,通過這個索引即可成功訪問到局部變量表中指定的局部變量值,當一個實例方法被調用的時候,它的方法參數和方法體內部定義的局部變量將會按照順序被複制到局部變量表中的每一個slot上,如果需要訪問局部變量表中一個64 bit的局部變量值時,只需要使用前一個索引即可(比如:訪問long或double類型變量)。

普通方法的局部變量表

  如果當前幀是由構造方法或者實例方法創建的,那麼該對象引用this將會存放在index為0的Slot處,其餘的參數按照參數表順序繼續排列。

(構造方法或)實例方法的局部變量表

變量槽的重複利用

  棧幀中的局部變量表中的槽位是可以重用的,如果一個局部變量過了其作用域,那麼在其作用域之後申明的新的局部變就很有可能會復用過期局部變量的槽位,從而達到節省資源的目的。

靜態變量與局部變量的對比

變量的分類:

★ 按數據類型分:基本數據類型、引用數據類型。

★ 按類中聲明的位置分:成員變量(類變量,實例變量)、局部變量。

☆ 類變量:linking的paper階段,給類變量默認賦值,init階段給類變量顯示賦值,即靜態代碼塊。

☆ 實例變量:隨着對象創建,會在堆空間中分配實例變量空間,並進行默認賦值。

☆ 局部變量:在使用前必須進行顯式賦值,不然編譯不通過。

  參數表分配完畢之後,再根據方法體內定義的變量的順序和作用域分配。

  我們知道類變量表有兩次初始化的機會,第一次是在「準備階段」,執行系統初始化,對類變量設置零值,另一次則是在「初始化」階段,賦予程序員在代碼中定義的初始值。

  和類變量初始化不同的是,局部變量表不存在系統初始化的過程,這意味着一旦定義了局部變量則必須人為的初始化,否則無法使用。

  在棧幀中,與性能調優關係最為密切的部分就是前面提到的局部變量表。在方法執行時,虛擬機使用局部變量表完成方法的傳遞。

  局部變量表中的變量也是重要的垃圾回收根節點,只要被局部變量表中直接或間接引用的對象都不會被回收。

操作數棧

  操作數棧(Operand Stack),每一個獨立的棧幀除了包含局部變量表以外,還包含一個後進先出(Last-In-First-Out)的操作數棧,也可以稱之為 表達式棧(Expression Stack)。

概述

  操作數棧,在方法執行過程中,根據位元組碼指令,往棧中寫入數據或提取數據,即入棧(push)和 出棧(pop)。

  某些位元組碼指令將值壓入操作數棧,其餘的位元組碼指令將操作數取出棧,使用它們後再把結果壓入棧。比如:執行複製、交換、求和等操作。

求和指令

代碼舉例:

  操作數棧,主要用於保存計算過程的中間結果,同時作為計算過程中變量臨時的存儲空間。

  操作數棧就是JVM執行引擎的一個工作區,當一個方法剛開始執行的時候,一個新的棧幀也會隨之被創建出來,這個方法的操作數棧是空的。注意:這個時候數組是有長度的,因為數組一旦創建,那麼就是不可變的。

  每一個操作數棧都會擁有一個明確的棧深度用於存儲數值,其所需的最大深度在編譯期就定義好了,保存在方法的Code屬性中名為maxstack的值中。

  棧中的任何一個元素都是可以任意的Java數據類型:

    ♦ 32bit的類型佔用一個棧單位深度。

    ♦ 64bit的類型佔用兩個棧單位深度。

  操作數棧並非採用訪問索引的方式來進行數據訪問的,而是只能通過標準的入棧和出棧操作來完成一次數據訪問。如果被調用的方法帶有返回值的話,其返回值將會被壓入當前棧幀的操作數棧中,並更新PC寄存器中下一條需要執行的位元組碼指令。

  操作數棧中元素的數據類型必須與位元組碼指令的序列嚴格匹配,這由編譯器在編譯器期間進行驗證,同時在類加載過程中的類檢驗階段的數據流分析階段要再次驗證。

  另外,我們說Java虛擬機的解釋引擎是基於棧的執行引擎,其中的棧指的就是操作數棧。

代碼追蹤

我們先寫一段代碼:

public void testAddOperation() {
    byte i = 15;
    int j = 8;
    int k = i + j;
}

使用javap 命令(javap -v 類名.class)反編譯class文件:

byte、short、char、boolean 內部都是使用int型來進行保存的。

從上面的代碼我們可以知道,我們都是通過bipush對操作數 15 和 8進行入棧操作

同時使用的是 iadd方法進行相加操作,i 代表的就是 int,也就是int類型的加法操作

執行流程如下所示:

  首先執行第一條語句,PC寄存器指向的是0,也就是指令地址為0,然後使用bipush讓操作數15入棧。

  執行完後,讓PC + 1,指向下一行代碼,下一行代碼就是將操作數棧的元素存儲到局部變量表1的位置,我們可以看到局部變量表的已經增加了一個元素:

為什麼局部變量表不是從0開始的呢?

  其實局部變量表也是從0開始的,但是因為0號位置存儲的是this指針,所以說就直接省略了。

  然後PC+1,指向的是下一行。讓操作數8也入棧,同時執行store操作,存入局部變量表中:

  然後從局部變量表中,依次將數據放在操作數棧中:

  然後將操作數棧中的兩個元素執行相加操作,並存儲在局部變量表3的位置:

  最後PC寄存器的位置指向10,也就是return方法,則直接退出方法。

棧頂緩存技術

棧頂緩存技術:Top Of Stack Cashing。

  前面提過,基於棧式架構的虛擬機所使用的零地址指令更加緊湊,但完成一項操作的時候必然需要使用更多的入棧和出棧指令,這同時也就意味着將需要更多的指令分派(instruction dispatch)次數和內存讀/寫次數。

  由於操作數是存儲在內存中的,因此頻繁地執行內存讀/寫操作必然會影響執行速度。為了解決這個問題,HotSpot JVM的設計者們提出了棧頂緩存(Tos,Top-of-Stack Cashing)技術,將棧頂元素全部緩存在物理CPU的寄存器中,以此降低對內存的讀/寫次數,提升執行引擎的執行效率。

基於寄存器架構:指令更少,執行速度快。

動態鏈接

動態鏈接、方法返回地址、附加信息 : 這些區域在有些地方被稱為幀數據區。

  動態鏈接:Dynamic Linking。每一個棧幀內部都包含一個指向運行時常量池中該棧幀所屬方法的引用,包含這個引用的目的就是為了支持當前方法的代碼能夠實現動態鏈接(Dynamic Linking)。比如:invokedynamic指令。

  在Java源文件被編譯到位元組碼文件中時,所有的變量和方法引用都作為符號引用(symbolic Reference)保存在class文件的常量池裡。

  比如:描述一個方法調用了另外的其他方法時,就是通過常量池中指向方法的符號引用來表示的,那麼動態鏈接的作用就是為了將這些符號引用轉換為調用方法的直接引用。

為什麼需要運行時常量池?

  因為在不同的方法里,都可能調用同一常量或者方法,所以只需要存儲一份即可,節省空間。常量池的作用就是為了提供一些符號和常量,便於指令的識別。

方法調用:解析與分配

  在JVM中,將符號引用轉換為調用方法的直接引用與方法的綁定機制相關。

鏈接

靜態鏈接

  當一個位元組碼文件被裝載進JVM內部時,如果被調用的目標方法在編譯期可知,且運行期保持不變時,這種情況下降調用方法的符號引用轉換為直接引用的過程稱之為靜態鏈接。

動態鏈接

  如果被調用的方法在編譯期無法被確定下來,也就是說,只能夠在程序運行期將調用的方法的符號轉換為直接引用,由於這種引用轉換過程具備動態性,因此也被稱之為動態鏈接。

綁定機制

  鏈接對應的方法的綁定機製為:早期綁定(Early Binding)和晚期綁定(Late Binding)。綁定是一個字段、方法或者類在符號引用被替換為直接引用的過程,這僅僅發生一次。

早期綁定

  早期綁定就是指被調用的目標方法如果在編譯期可知,且運行期保持不變時,即可將這個方法與所屬的類型進行綁定,這樣一來,由於明確了被調用的目標方法究竟是哪一個,因此也就可以使用靜態鏈接的方式將符號引用轉換為直接引用。

晚期綁定

  如果被調用的方法在編譯期無法被確定下來,只能夠在程序運行期根據實際的類型綁定相關的方法,這種綁定方式也就被稱之為晚期綁定。

虛方法和非虛方法

  如果方法在編譯期就確定了具體的調用版本,這個版本在運行時是不可變的,這樣的方法稱為非虛方法。

  靜態方法、私有方法、fina1方法、實例構造器、父類方法都是非虛方法。

  其他方法稱為虛方法。

子類對象的多態的使用前提:

  • 類的繼承關係

  • 方法的重寫

虛擬機中提供了以下幾條方法調用指令:

普通調用指令:

    • invokestatic:調用靜態方法,解析階段確定唯一方法版本。

    • invokespecial:調用<init>方法、私有及父類方法,解析階段確定唯一方法版本。

    • invokevirtual:調用所有虛方法。

    • invokeinterface:調用接口方法。

動態調用指令:

    • invokedynamic:動態解析出需要調用的方法,然後執行

  前四條指令固化在虛擬機內部,方法的調用執行不可人為干預,而invokedynamic指令則支持由用戶確定方法版本。其中invokestatic指令和invokespecial指令調用的方法稱為非虛方法,其餘的(fina1修飾的除外)稱為虛方法。

invokednamic指令

  JVM位元組碼指令集一直比較穩定,一直到Java7中才增加了一個invokedynamic指令,這是Java為了實現『動態類型語言』支持而做的一種改進。

  但是在Java7中並沒有提供直接生成invokedynamic指令的方法,需要藉助ASM這種底層位元組碼工具來產生invokedynamic指令。直到Java8的Lambda表達式的出現,invokedynamic指令的生成,在Java中才有了直接的生成方式。

  Java7中增加的動態語言類型支持的本質是對Java虛擬機規範的修改,而不是對Java語言規則的修改,這一塊相對來講比較複雜,增加了虛擬機中的方法調用,最直接的受益者就是運行在Java平台的動態語言的編譯器。

動態類型語言和靜態類型語言

  動態類型語言和靜態類型語言兩者的區別就在於:對類型的檢查是在編譯期還是在運行期,滿足前者就是靜態類型語言,反之是動態類型語言。

  說的再直白一點就是,靜態類型語言是判斷變量自身的類型信息;動態類型語言是判斷變量值的類型信息,變量沒有類型信息,變量值才有類型信息,這是動態語言的一個重要特徵。

Java:String info = “mogu blog”; (Java是靜態類型語言的,會先編譯就進行類型檢查)

JS:var name = “shkstart”; var name = 10; (JS是動態語言,運行時才進行檢查)

方法重寫的本質

Java 語言中方法重寫的本質:

  ✔ 找到操作數棧頂的第一個元素所執行的對象的實際類型,記作C。

  ✔ 如果在類型C中找到與常量中的描述、簡單名稱都相符的方法,則進行訪問權限校驗,如果通過則返回這個方法的直接引用,查找過程結束;如果不通過,則返回java.lang.IllegalAccessError 異常。

  ✔ 否則,按照繼承關係從下往上依次對C的各個父類進行第2步的搜索和驗證過程。

  ✔ 如果始終沒有找到合適的方法,則拋出java.lang.AbstractMethodError異常。

IllegalAccessError介紹

  程序試圖訪問或修改一個屬性或調用一個方法,卻沒有權限訪問,一般會引起編譯器異常。這個錯誤如果發生在運行時,就說明一個類發生了不兼容的改變。

方法的調用:虛方法表

  在面向對象的編程中,會很頻繁的使用到動態分派,如果在每次動態分派的過程中都要重新在類的方法元數據中搜索合適的目標的話就可能影響到執行效率。因此,為了提高性能,JVM採用在類的方法區建立一個虛方法表 (virtual method table)(非虛方法不會出現在表中)來實現,使用索引表來代替查找。

  每個類中都有一個虛方法表,表中存放着各個方法的實際入口。

虛方法表是什麼時候被創建的呢?

  虛方法表會在類加載的鏈接階段被創建並開始初始化,類的變量初始值準備完成之後,JVM會把該類的方法表也初始化完畢。

  如圖所示,當類中重寫了方法,那麼調用的時候,就會直接在虛方法表中查找,否則將會直接連接到Object的方法中。

方法返回地址

  方法返回地址中存放的是:調用該方法的上級方法的PC寄存器中所存的值。

  一個方法的結束,有兩種方式:

    1.正常執行完成

    2.出現未處理的異常,非正常退出

  無論通過哪種方式退出,在方法退出後都返回到該方法被調用的位置。方法正常退出時,調用者的PC計數器的值作為返回地址,即調用該方法的指令的下一條指令的地址。而通過異常退出的,返回地址是要通過異常表來確定,棧幀中一般不會保存這部分信息。

當一個方法開始執行後,只有兩種方式可以退出這個方法:

  ① 執行引擎遇到任意一個方法返回的位元組碼指令(return),會有返回值傳遞給上層的方法調用者,簡稱正常完成出口。

  ▶ 一個方法在正常調用完成之後,究竟需要使用哪一個返回指令,還需要根據方法返回值的實際數據類型而定。

  ▶ 在位元組碼指令中,返回指令包含ireturn(當返回值是boolean,byte,char,short和int類型時使用),lreturn(Long類型),freturn(Float類型),dreturn(Double類型),areturn(引用類型)。另外還有一個return指令聲明為void的方法,實例初始化方法,類和接口的初始化方法使用。

  ② 在方法執行過程中遇到異常(Exception),並且這個異常沒有在方法內進行處理,也就是只要在本方法的異常表中沒有搜索到匹配的異常處理器,就會導致方法退出,簡稱異常完成出口。

  ▶ 方法執行過程中,拋出異常時的異常處理,存儲在一個異常處理表,方便在發生異常的時候找到處理異常的代碼。

  本質上,方法的退出就是當前棧幀出棧的過程。此時,需要恢復上層方法的局部變量表、操作數棧、將返回值壓入調用者棧幀的操作數棧、設置PC寄存器值等,讓調用者方法繼續執行下去。

  正常完成出口和異常完成出口的區別在於:通過異常完成出口退出的不會給它的上層調用者產生任何的返回值。

一些附加信息

  棧幀中還允許攜帶與Java虛擬機實現相關的一些附加信息。例如:對程序調試提供支持的信息。

相關的面試題

舉例棧溢出的情況?

  (StackOverflowError)

如何設置棧的大小?

  通過 -Xss 參數。

調整棧大小,就能保證不出現溢出么?

  不能保證不溢出。

分配的棧內存越大越好么?

  不是,棧內存分配越大,一定時間內降低了OOM概率,但是會擠占其它的線程空間,因為整個內存空間是有限的。

垃圾回收是否涉及到虛擬機棧?

  線程私有,不涉及。

方法中定義的局部變量是否線程安全?

  如果對象是在內部產生,並在內部消亡,沒有返回到外部,那麼它就是線程安全的,反之則是線程不安全的。

運行時數據區,是否存在Error和GC?