第38篇-解釋方法之間的調用小實例

2021 年 11 月 8 日
筆記

這一篇我們介紹一下解釋執行的main()方法調用解析執行的add()方法的小實例，這個例子如下：

package com.classloading;

public class TestInvokeMethod {
	public int add(int a, int b) {
		return a + b;
	}

	public static void main(String[] args) {
		TestInvokeMethod tim = new TestInvokeMethod();
		tim.add(2, 3);
	}
}

通過Javac編譯器編譯為位元組碼文件，如下：

Constant pool:
   #1 = Methodref          #5.#16         // java/lang/Object."<init>":()V
   #2 = Class              #17            // com/classloading/TestInvokeMethod
   #3 = Methodref          #2.#16         // com/classloading/TestInvokeMethod."<init>":()V
   #4 = Methodref          #2.#18         // com/classloading/TestInvokeMethod.add:(II)I
   #5 = Class              #19            // java/lang/Object
   #6 = Utf8               <init>
   #7 = Utf8               ()V
   #8 = Utf8               Code
   #9 = Utf8               LineNumberTable
  #10 = Utf8               add
  #11 = Utf8               (II)I
  #12 = Utf8               main
  #13 = Utf8               ([Ljava/lang/String;)V
  #14 = Utf8               SourceFile
  #15 = Utf8               TestInvokeMethod.java
  #16 = NameAndType        #6:#7          // "<init>":()V
  #17 = Utf8               com/classloading/TestInvokeMethod
  #18 = NameAndType        #10:#11        // add:(II)I
  #19 = Utf8               java/lang/Object
{
  public com.classloading.TestInvokeMethod();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return

  public int add(int, int);
    descriptor: (II)I
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=3, args_size=3
         0: iload_1
         1: iload_2
         2: iadd
         3: ireturn

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=3, locals=2, args_size=1
         0: new           #2                  // class com/classloading/TestInvokeMethod
         3: dup
         4: invokespecial #3                  // Method "<init>":()V
         7: astore_1
         8: aload_1
         9: iconst_2
        10: iconst_3
        11: invokevirtual #4                  // Method add:(II)I
        14: pop
        15: return
}

下面分幾部分介紹調用相關的內容。

1、C++函數調用main()方法

現在我們從位元組碼索引為8的aload_1開始看，此時的棧幀狀態如下：

由於aload_1的tos_out為atos，所以在棧頂快取的暫存器中會快取有TestInvokeMethod實例的地址，當執行iconst_2時，會從atos進入。iconst_2指令的彙編如下：

//  aep
push   %rax
jmpq   // 跳轉到下面那條指令執行

// ...

mov    $0x2,%eax // 指令的彙編程式碼

由於iconst_2的tos_out為itos，所以在進入下一個指令時，會從iconst_3的tos_int為itos中進入，如下：　　

// iep
push   %rax

mov    $0x3,%eax

接下來就是執行invokevirtual位元組碼指令了，此時的2已經壓入了表達式棧，而3在%eax暫存器中做為棧頂快取，但是invokevirtual的tos_in為vtos，所以從invokevirtual位元組碼指令的iep進入時會將%eax暫存器中的值也壓入表達式棧中，最終的棧狀態如下圖所示。

2、main()方法調用add()方法

invokevirtual位元組碼指令在執行時，假設此位元組碼指令已經解析完成，也就是對應的ConstantPoolCacheEntry中已經保存了方法調用相關的資訊，則執行的相關彙編程式碼如下：

0x00007fffe1021f90: mov    %r13,-0x38(%rbp)    // 將bcp保存到棧中
// invokevirtual x中取出x，也就是常量池索引存儲到%edx，
// 其實這裡已經是ConstantPoolCacheEntry的index，因為在類的連接
// 階段會對方法中特定的一些位元組碼指令進行重寫
0x00007fffe1021f94: movzwl 0x1(%r13),%edx 
// 將ConstantPoolCache的首地址存儲到%rcx
 
 
0x00007fffe1021f99: mov    -0x28(%rbp),%rcx    
 
// 左移2位，因為%edx中存儲的是ConstantPoolCacheEntry索引，左移2位是因為
// ConstantPoolCacheEntry佔用4個字
0x00007fffe1021f9d: shl    $0x2,%edx    
        
// 計算%rcx+%rdx*8+0x10，獲取ConstantPoolCacheEntry[_indices,_f1,_f2,_flags]中的_indices
// 因為ConstantPoolCache的大小為0x16位元組，%rcx+0x10定位
// 到第一個ConstantPoolCacheEntry的位置
// %rdx*8算出來的是相對於第一個ConstantPoolCacheEntry的位元組偏移
0x00007fffe1021fa0: mov    0x10(%rcx,%rdx,8),%ebx 
 
// 獲取ConstantPoolCacheEntry中indices[b2,b1,constant pool index]中的b2
0x00007fffe1021fa4: shr    $0x18,%ebx 
 
// 取出indices中含有的b2，即bytecode存儲到%ebx中
0x00007fffe1021fa7: and    $0xff,%ebx    
 
// 查看182的bytecode是否已經連接      
0x00007fffe1021fad: cmp    $0xb6,%ebx    
  
// 如果連接就進行跳轉，跳轉到resolved     
0x00007fffe1021fb3: je     0x00007fffe1022052

我們直接看方法解析後的邏輯實現，如下：

// **** resolved ****
// resolved的定義點，到這裡說明invokevirtual位元組碼已經連接
// 獲取ConstantPoolCacheEntry::_f2,這個欄位只對virtual有意義
// 在計算時，因為ConstantPoolCacheEntry在ConstantPoolCache之後保存，
// 所以ConstantPoolCache為0x10，而
// _f2還要偏移0x10，這樣總偏移就是0x20
// ConstantPoolCacheEntry::_f2存儲到%rbx
0x00007fffe1022052: mov    0x20(%rcx,%rdx,8),%rbx  
 // ConstantPoolCacheEntry::_flags存儲到%edx
0x00007fffe1022057: mov    0x28(%rcx,%rdx,8),%edx 
 // 將flags移動到ecx中
0x00007fffe102205b: mov    %edx,%ecx      
// 從flags中取出參數大小        
0x00007fffe102205d: and    $0xff,%ecx     
 
          
// 獲取到recv,%rcx中保存的是參數大小，最終計算參數所需要的大小為%rsp+%rcx*8-0x8，
// flags中的參數大小對實例方法來說，已經包括了recv的大小
// 如調用實例方法的第一個參數是this(recv)
0x00007fffe1022063: mov    -0x8(%rsp,%rcx,8),%rcx  // recv保存到%rcx 
 
// 將flags存儲到r13中
0x00007fffe1022068: mov    %edx,%r13d              
// 從flags中獲取return type，也就是從_flags的高4位保存的TosState
0x00007fffe102206b: shr    $0x1c,%edx 
 
// 將TemplateInterpreter::invoke_return_entry地址存儲到%r10
0x00007fffe102206e: movabs $0x7ffff73b6380,%r10 
// %rdx保存的是return type，計算返回地址
// 因為TemplateInterpreter::invoke_return_entry是數組，
// 所以要找到對應return type的入口地址
0x00007fffe1022078: mov    (%r10,%rdx,8),%rdx 
// 向棧中壓入返回地址
0x00007fffe102207c: push   %rdx      
 
// 還原ConstantPoolCacheEntry::_flags            
0x00007fffe102207d: mov    %r13d,%edx             
// 還原bcp
0x00007fffe1022080: mov    -0x38(%rbp),%r13

執行完如上的程式碼後，已經向相關的暫存器中存儲了相關的值。相關的暫存器狀態如下：

rbx: 存儲的是ConstantPoolCacheEntry::_f2屬性的值
rcx: 就是調用實例方法時的第一個參數this
rdx: 存儲的是ConstantPoolCacheEntry::_flags屬性的值

棧的狀態如下圖所示。

需要注意的是return address也是一個常式的地址，是TemplateInterpreter::invoke_return_entry一維數組中類型為整數對應的下標存儲的那個地址，因為調用add()方法返回的是整數類型。如何得出add()方法的返回類型呢？是從ConstantPoolCacheEntry的_flags的TosState中得出的。

下面繼續看invokevirtual位元組碼指令將要執行的彙編程式碼，如下：

// flags存儲到%eax
0x00007fffe1022084: mov    %edx,%eax     
// 測試調用的方法是否為final        
0x00007fffe1022086: and    $0x100000,%eax    
// 如果不為final就直接跳轉到----notFinal----    
0x00007fffe102208c: je     0x00007fffe10220c0     
 
// 通過(%rcx)來獲取receiver的值，如果%rcx為空，則會引起OS異常
0x00007fffe1022092: cmp (%rcx),%rax 
 
// 省略統計相關程式碼部分
 
// 設置調用者棧頂並保存
0x00007fffe10220b4: lea    0x8(%rsp),%r13
0x00007fffe10220b9: mov    %r13,-0x10(%rbp)
 
// 跳轉到Method::_from_interpretered_entry入口去執行
0x00007fffe10220bd: jmpq   *0x58(%rbx)

執行Method::_from_interpretered_entry常式，這個常式在之前詳細介紹過，執行完成後會為add()方法創建棧幀，此時的棧狀態如下圖所示。

執行iload_0與iload_1指令，由於連續出現了2個iload，所以是_fast_iload2，彙編如下：

movzbl  0x1(%r13),%ebx
neg     %rbx
mov     (%r14,%rbx,8),%eax
push    %rax
movzbl  0x3(%r13),%ebx
neg     %rbx
mov     (%r14,%rbx,8),%eax

注意，只有第1個變數壓入了棧，第2個則存儲到%eax中做為棧頂快取。　

調用iadd指令，由於tos_in為itos，所以彙編如下：

mov    (%rsp),%edx
add    $0x8,%rsp
add    %edx,%eax

最後結果快取在%eax中。　

3、退出add()方法

執行ireturn位元組碼指令進行add()方法的退棧操作。對於實例來說，執行的相關彙編程式碼如下：

// 將JavaThread::do_not_unlock_if_synchronized屬性存儲到%dl中
0x00007fffe101b770: mov    0x2ad(%r15),%dl
// 重置JavaThread::do_not_unlock_if_synchronized屬性值為false
0x00007fffe101b777: movb   $0x0,0x2ad(%r15)
 
// 將Method*載入到%rbx中
0x00007fffe101b77f: mov    -0x18(%rbp),%rbx
// 將Method::_access_flags載入到%ecx中
0x00007fffe101b783: mov    0x28(%rbx),%ecx
// 檢查Method::flags是否包含JVM_ACC_SYNCHRONIZED
0x00007fffe101b786: test   $0x20,%ecx
// 如果方法不是同步方法，跳轉到----unlocked----
0x00007fffe101b78c: je     0x00007fffe101b970

unlocked處的彙編實現如下：　　

// 將-0x8(%rbp)處保存的old stack pointer(saved rsp)取出來放到%rbx中
0x00007fffe101bac7: mov    -0x8(%rbp),%rbx
 
// 移除棧幀
// leave指令相當於：
//     mov %rbp, %rsp
//     pop %rbp
0x00007fffe101bacb: leaveq 
// 將返回地址彈出到%r13中
0x00007fffe101bacc: pop    %r13
// 設置%rsp為調用者的棧頂值
0x00007fffe101bace: mov    %rbx,%rsp
0x00007fffe101bad1: jmpq   *%r13

執行leaveq指令進行退棧操作，此時的棧狀態如下圖所示。

然後我們就要彈出返回地址，跳轉到TemplateInterpreter::invoke_return_entry數組中保存的相關地址去執行對應的常式了。

4、執行返回常式

對於實例來說，傳遞的state為itos時生成的彙編程式碼如下：

// 將-0x10(%rbp)存儲到%rsp後，置空-0x10(%rbp)
0x00007fffe1006ce0: mov    -0x10(%rbp),%rsp   // 更改rsp
0x00007fffe1006ce4: movq   $0x0,-0x10(%rbp)   // 更改棧中特定位置的值
// 恢復bcp和locals，使%r14指向本地變數表，%r13指向bcp
0x00007fffe1006cec: mov    -0x38(%rbp),%r13
0x00007fffe1006cf0: mov    -0x30(%rbp),%r14
 // 獲取ConstantPoolCacheEntry的索引並載入到%ecx
0x00007fffe1006cf4: movzwl 0x1(%r13),%ecx     

 // 獲取棧中-0x28(%rbp)的ConstantPoolCache並載入到%ecx
0x00007fffe1006cf9: mov    -0x28(%rbp),%rbx   
// shl是邏輯左移，獲取字偏移
0x00007fffe1006cfd: shl    $0x2,%ecx           
// 獲取ConstantPoolCacheEntry中的_flags屬性值
0x00007fffe1006d00: mov    0x28(%rbx,%rcx,8),%ebx
// 獲取_flags中的低8位中保存的參數大小
0x00007fffe1006d04: and    $0xff,%ebx          

// lea指令將地址載入到記憶體暫存器中，也就是恢復調用方法之前棧的樣子
0x00007fffe1006d0a: lea    (%rsp,%rbx,8),%rsp  

// 跳轉到下一指令執行
0x00007fffe1006d0e: movzbl 0x3(%r13),%ebx  
0x00007fffe1006d13: add    $0x3,%r13
0x00007fffe1006d17: movabs $0x7ffff73b7ca0,%r10
0x00007fffe1006d21: jmpq   *(%r10,%rbx,8)

如上的彙編程式碼也是執行的退棧操作，最主要的就是把在調用解釋執行方法時壓入的實參從棧中彈出，接著就是執行main()方法中invokevirtual中的下一條指令pop。此時的棧狀態如下圖所示。

需要注意的是，此時的棧頂快取中存儲著調用add()方法的執行結果，那麼在跳轉到下一條指令pop時，必須要從pop的iep入口進入，這樣就能正確的執行下去了。

5、退出main()方法

當執行pop指令時，會從iep入口進入，執行的彙編程式碼如下：

// iep
push   %rax

// ...

add    $0x8,%rsp

由於main()方法調用add()方法不需要返回結果，所以對於main()方法來說，這個結果會從main()方法的表達式棧中彈出。下面接著執行return指令，這個指令對應的彙編程式碼如下：

// 將JavaThread::do_not_unlock_if_synchronized屬性存儲到%dl中
0x00007fffe101b770: mov    0x2ad(%r15),%dl
// 重置JavaThread::do_not_unlock_if_synchronized屬性值為false
0x00007fffe101b777: movb   $0x0,0x2ad(%r15)

// 將Method*載入到%rbx中
0x00007fffe101b77f: mov    -0x18(%rbp),%rbx
// 將Method::_access_flags載入到%ecx中
0x00007fffe101b783: mov    0x28(%rbx),%ecx
// 檢查Method::flags是否包含JVM_ACC_SYNCHRONIZED
0x00007fffe101b786: test   $0x20,%ecx
// 如果方法不是同步方法，跳轉到----unlocked----
0x00007fffe101b78c: je     0x00007fffe101b970

main()方法為非同步方法，所以跳轉到unlocked，在unlocked邏輯中會執行一些釋放鎖的邏輯，對於我們本實例來說這不重要，我們直接看退棧的操作，如下：

// 將-0x8(%rbp)處保存的old stack pointer(saved rsp)取出來放到%rbx中
0x00007fffe101bac7: mov    -0x8(%rbp),%rbx

// 移除棧幀
// leave指令相當於：
//     mov %rbp, %rsp
//     pop %rbp
0x00007fffe101bacb: leaveq 
// 將返回地址彈出到%r13中
0x00007fffe101bacc: pop    %r13
// 設置%rsp為調用者的棧頂值
0x00007fffe101bace: mov    %rbx,%rsp
0x00007fffe101bad1: jmpq   *%r13

最後的棧狀態如下圖所示。

其中的return address是C++語言的返回地址，接下來如何退出如上的一些棧幀及結束方法就是C++的事兒了。

公眾號 深入剖析Java虛擬機HotSpot 已經更新虛擬機源程式碼剖析相關文章到60+，歡迎關注，如果有任何問題，可加作者微信mazhimazh，拉你入虛擬機群交流