第50篇-調用約定(2)
- 2022 年 1 月 7 日
- 筆記
前面已經介紹了解釋執行的Java方法、編譯執行的Java方法和native方法的調用約定。這一篇我們看一下HotSpot VM中輔助實現調用約定的相關函數。
1、SharedRuntime::java_calling_convention()函數
當需要編譯執行Java方法時,會調用SharedRuntime::java_calling_convention()函數,此函數的實現如下:
int SharedRuntime::java_calling_convention( const BasicType *sig_bt, // sig_bt相當於是數組 VMRegPair *regs, int total_args_passed, int is_outgoing // 值一般為false ) { // Register的類型為RegisterImpl*,而VMReg的類型為VMRegImpl* // 通過數組來將相關的參數存儲到對應的寄存器上 static const Register INT_ArgReg[Argument::n_int_register_parameters_j] = { j_rarg0, // 6 j_rarg1, // 2 j_rarg2, // 1 j_rarg3, // 8 j_rarg4, // 9 j_rarg5 // 7 }; static const XMMRegister FP_ArgReg[Argument::n_float_register_parameters_j] = { j_farg0, // 0 j_farg1, // 1 j_farg2, // 2 j_farg3, // 3 j_farg4, // 4 j_farg5, // 5 j_farg6, // 6 j_farg7 // 7 }; // ... }
在調用如上函數時,會傳入表示Java方法參數的類型數組sig_bt,總的參數數量total_args_passed。我們將要傳遞參數使用的寄存器和棧slot通過regs數組來保存。其中的BasicType枚舉類的定義如下:
enum BasicType { T_BOOLEAN = 4, T_CHAR = 5, T_FLOAT = 6, T_DOUBLE = 7, T_BYTE = 8, T_SHORT = 9, T_INT = 10, T_LONG = 11, T_OBJECT = 12, T_ARRAY = 13, T_VOID = 14, T_ADDRESS = 15, // t_address ret指令用到的表示返回地址的returnAddress類型 T_NARROWOOP = 16, // t_narrowoop T_METADATA = 17, // t_metadata T_NARROWKLASS = 18, // t_narrowklass T_CONFLICT = 19, // t_conflict for stack value type with conflicting contents T_ILLEGAL = 99 // t_illegal };
如上枚舉類中定義的類型已經足夠表示Java位元組碼中的任何類型了,所以Java方法中的類型會統一使用如上枚舉類來表示。
VMRegPair類的定義如下:
class VMRegPair { private: VMReg _second; VMReg _first; public: void set_bad () { _second=VMRegImpl::Bad(); _first=VMRegImpl::Bad(); } void set1 (VMReg v) { _second=VMRegImpl::Bad(); // 值為-1 _first=v; } void set2 (VMReg v) { _second=v->next(); // 就是v的值加1 _first=v; } // ... }
我們看到了這個類中定義了_first和_second這一對寄存器,這主要是為32位實現考慮的,因為32位在傳遞long或double類型的參數時,需要2個寄存器來完成,一個存儲高32位,一個存儲低32位。對於64位來說,通過只使用_first寄存器就可完成任務。所以我們在討論64位實現時,可不用太在意_second屬性。
VMRegPair中的_first和_second屬性的類型為VMReg。VMReg是VMRegImpl*的別名,定義如下:
typedef VMRegImpl* VMReg; // 這個類中只有靜態屬性,並且也沒虛函數,所以佔用的內存大小為1個字 class VMRegImpl { private: enum { BAD = -1 }; static VMReg stack0; public: static VMReg as_VMReg(int val, bool bad_ok = false) { assert(val > BAD || bad_ok, "invalid"); // 一個整數轉換為VMRegImpl*,注意VMReg是VMRegImpl*的別名 return (VMReg) (intptr_t) val; } static VMReg stack2reg( int idx ) { intptr_t x = stack0->value(); // x的值為184 return (VMReg) (intptr_t) (x + idx); // stack0->value()的值為184 } uintptr_t reg2stack() { return value() - stack0->value(); } // ... }
需要注意的是,stack0是VMReg類型,也就是指針類型,指針類型是可以直接和整數相互轉換的,所以我們通常會在stack0中存儲一個整數。通過判斷這個整數,我們能夠知道,當前的VMRegImpl實例到底代表的是通用寄存器、浮點寄存器還是棧上的位置。
在C/C++函數中,可將整數轉換為指針類型,因為指針類型表示地址,其實地址也是一個數值。舉個例子,如下:
// 定義一個空類a,佔用的內存空間大小為1 class a{}; int num = 2; // 將整數轉換為指針,這是被允許的 a* res = (a*)num;
直接將一個整數轉換為指針類型。但是我們在使用時要記住,這通常不是一個合法的地址。
繼續看函數的實現邏輯:
int SharedRuntime::java_calling_convention( const BasicType *sig_bt, // sig_bt相當於是數組 VMRegPair *regs, int total_args_passed, int is_outgoing ) { // ... uint int_args = 0; uint fp_args = 0; // 如果寄存器使用完,則多出來的參數需要通過棧來傳遞,這個變量記錄需要的 // slot(這裡為了考慮32位情況,每個slot是4個位元組,所以在64位情況下, // 每次需要2個slot,所以stk_args每次需要增加2 uint stk_args = 0; for (int i = 0; i < total_args_passed; i++) { switch (sig_bt[i]) { // sig_bt[i]的類型為字,當前是64位,8個位元組 case T_BOOLEAN: case T_CHAR: case T_BYTE: case T_SHORT: case T_INT: // 當小於6個參數時,參數放在寄存器上,n_int_register_parameters_j=6 if (int_args < Argument::n_int_register_parameters_j) { VMReg tmp = INT_ArgReg[int_args++]->as_VMReg(); // VMReg是VMRegImpl*類型的別名 regs[i].set1(tmp); } else { // 放在棧上 VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set1(tmp); stk_args += 2; } break; case T_VOID: // halves of T_LONG or T_DOUBLE // long和double需要2個slot(這裡的slot為8位元組) assert(i != 0 && (sig_bt[i - 1] == T_LONG || sig_bt[i - 1] == T_DOUBLE), "expecting half"); regs[i].set_bad(); break; case T_LONG: assert(sig_bt[i + 1] == T_VOID, "expecting half"); case T_OBJECT: case T_ARRAY: case T_ADDRESS: if (int_args < Argument::n_int_register_parameters_j) { VMReg tmp = INT_ArgReg[int_args++]->as_VMReg(); regs[i].set2(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set2(tmp); stk_args += 2; } break; case T_FLOAT: if (fp_args < Argument::n_float_register_parameters_j) { VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg(); regs[i].set1(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set1(tmp); stk_args += 2; } break; case T_DOUBLE: assert(sig_bt[i + 1] == T_VOID, "expecting half"); if (fp_args < Argument::n_float_register_parameters_j) { VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg(); regs[i].set2(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set2(tmp); stk_args += 2; } break; default: ShouldNotReachHere(); break; } } return round_to(stk_args, 2); }
當類型為非浮點數類型時,通過通用寄存器來傳遞。通過通用寄存器傳遞參數時,如果為boolean、byte、short、char和int時,調用VMRegPair::set1()函數,否則調用VMRegPair::set2()函數。對於64位來說,我們不需要關注VMRegPair::_second屬性的值,所以我們只關心_first參數的值即可。
最終會在regs數組中存儲與參數個數相同的VMRegPair個實例,我們總結一下:
(1)當存儲T_BOOLEAN、T_BYTE、T_SHORT、T_CHAR和T_INT時,_first的值小於32,表示使用通用寄存器來傳遞參數;
(2)當存儲T_OBJECT、T_ARRAY、T_ADDRESS和T_LONG類型時,_first的值是仍然小於32,表示使用通用寄存器來傳遞參數;
(3)當存儲T_FLOAT和T_DOUBLE時,_first的值大於等於48,小於148,表示使用浮點寄存器來傳遞參數;
(4)當存儲的_first的值大於等於148時,表示對應的參數需要通過棧來傳遞;
(5)當_first的值為其它時,非法;
只有在寄存器用完後才會通過棧來傳遞參數,所以要通過stk_args來統計需要開闢多大的棧空間。舉個例子如下:
public static native void arraycopy(Object src, int srcPos, Object dest, int destPos, int length);
本地方法共有5個參數,所以可以通過前5個寄存器來傳遞參數。函數入參為:
const int total_args_passed=5 BasicType* sig_bbt=[T_OBJECT,T_INT,T_INT,T_OBJECT,T_INT,T_INT]
最終stk_args為0,而regs的值如下:
VMRegPair* in_regs=[ VMRegPair(_first=6*2,_second=13) // 傳遞的是T_OBJECT VMRegPair(_first=2*2,_second=-1) VMRegPair(_first=1*2,_second=-1) VMRegPair(_first=8*2,_second=17) // 傳遞的是T_OBJECT VMRegPair(_first=9*2,_second=-1) ]
我們可以通過判斷_first的值來區分出浮點類型與其它剩餘類型。由於如上的5個參數都是通過通用寄存器傳遞的,所以_first的值都小於32。
2、SharedRuntime::c_calling_convention()函數
調用的函數的實現如下:
int SharedRuntime::c_calling_convention( const BasicType *sig_bt, VMRegPair *regs, int total_args_passed ){ // 共需要向C傳遞的參數數量 // Register的定義為RegisterImpl* static const Register INT_ArgReg[Argument::n_int_register_parameters_c] = { c_rarg0, // 0x7 c_rarg1, // 0x6 c_rarg2, // 0x2 c_rarg3, // 0x1 c_rarg4, // 0x8 c_rarg5 // 0x9 }; static const XMMRegister FP_ArgReg[Argument::n_float_register_parameters_c] = { c_farg0, c_farg1, c_farg2, c_farg3, c_farg4, c_farg5, c_farg6, c_farg7 }; uint int_args = 0; uint fp_args = 0; uint stk_args = 0; // inc by 2 each time // 參數優先向寄存器中分配,如果沒有寄存器時再向棧中分配 for (int i = 0; i < total_args_passed; i++) { switch (sig_bt[i]) { case T_BOOLEAN: case T_CHAR: case T_BYTE: case T_SHORT: case T_INT: if (int_args < Argument::n_int_register_parameters_c) { VMReg tmp = INT_ArgReg[int_args++]->as_VMReg(); regs[i].set1(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set1(tmp); stk_args += 2; } break; case T_LONG: assert(sig_bt[i + 1] == T_VOID, "expecting half"); // fall through case T_OBJECT: case T_ARRAY: case T_ADDRESS: case T_METADATA: // n_int_register_parameters_c的值為6 if (int_args < Argument::n_int_register_parameters_c) { VMReg tmp = INT_ArgReg[int_args++]->as_VMReg() ; regs[i].set2( tmp ); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set2(tmp); stk_args += 2; } break; case T_FLOAT: if (fp_args < Argument::n_float_register_parameters_c) { VMReg tmp = FP_ArgReg[fp_args++]->as_VMReg(); regs[i].set1(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set1(tmp); stk_args += 2; } break; case T_DOUBLE: assert(sig_bt[i + 1] == T_VOID, "expecting half"); if (fp_args < Argument::n_float_register_parameters_c) { VMReg tmp =FP_ArgReg[fp_args++]->as_VMReg(); regs[i].set2(tmp); } else { VMReg tmp = VMRegImpl::stack2reg(stk_args); regs[i].set2(tmp); stk_args += 2; } break; case T_VOID: // Halves of longs and doubles assert(i != 0 && (sig_bt[i - 1] == T_LONG || sig_bt[i - 1] == T_DOUBLE), "expecting half"); regs[i].set_bad(); break; default: ShouldNotReachHere(); break; } } return stk_args; }
其實現非常類似於SharedRuntime::java_calling_convention()函數,這裡不再過多介紹。
arraycopy()對應的本地函數的實現如下:
JVM_ENTRY(void, JVM_ArrayCopy( JNIEnv *env, jclass ignored, jobject src, jint src_pos, jobject dst, jint dst_pos, jint length)) // ... arrayOop s = arrayOop(JNIHandles::resolve_non_null(src)); arrayOop d = arrayOop(JNIHandles::resolve_non_null(dst)); // 進行數組的拷貝操作 s->klass()->copy_array(s, src_pos, d, dst_pos, length, thread); JVM_END
共有7個參數,所以在調用本地函數時,需要將1個參數存儲在棧上。入參及計算的最終的regs的值如下:
const int total_args_passed=5 BasicType* sig_bbt=[T_OBJECT,T_INT,T_INT,T_OBJECT,T_INT,T_INT] VMRegPair* regs=[ VMRegPair(_first=6*2,_second=13) // 傳遞的是T_OBJECT VMRegPair(_first=2*2,_second=-1) VMRegPair(_first=1*2,_second=-1) VMRegPair(_first=8*2,_second=17) // 傳遞的是T_OBJECT VMRegPair(_first=9*2,_second=-1) ]
6個值都可以通過通用寄存器傳遞,所以_first的值都小於32。另外還有個整數需要傳遞,所以stk_args的值為2(表示用2個、每個大小為4位元組的slot傳遞整數類型參數)。需要注意的是,對於64位來說,如果要傳遞long和double類型的值,其實也需要2個4位元組大小的slot即可,也就是1個8位元組的slot即可,並不是需要2個8位元組的slot,這是由調用約定規定的。
公眾號 深入剖析Java虛擬機HotSpot 已經更新虛擬機源代碼剖析相關文章到60+,歡迎關注,如果有任何問題,可加作者微信mazhimazh,拉你入虛擬機群交流