深入分析Java的編譯期與運行期

  • 2019 年 10 月 3 日
  • 筆記

不知大家有沒有思考過,當我們使用IDE寫了一個Demo類,並執行main函數列印 hello world時都經歷了哪些流程么?
想通過這篇文章來分析分析Java的執行流程,或者換句話說想聊聊Java的編譯期與運行期的流程。

  • 開門見山
  • 編譯期間都做了什麼
  • 運行期間都做了什麼

1. 開門見山

public class MyApp {        public static void main(String[] args) {          System.out.println("hello world");      }  }

假如我們寫了一個MyApp.java,並要列印『hello world』 那它需要經過哪些步驟?

第一步compile

通過編譯器進行編譯,從Java源碼 —> Java 位元組碼

這個編譯器則是jdk 里的javac 編譯器,我們只需 javac MyApp.java 即可以編譯該源碼,javac 編譯器位於jdk –> bin –>javac

第二步load and execute

載入java 位元組碼並執行

可以通過jdk 里的java命令運行java位元組碼,我們只需 java MyApp.class 即可載入並執行該位元組碼,當運行java命令時,JRE將與您指定的類一起載入。然後,執行該類的主要方法。

java命令位於jdk –> bin –>java。

上面只是大概講了運行一個java程式的流程,下面再從編譯期以及運行期的角度在剖析一下細節。

2. 編譯期間都做了什麼?

編譯器(compiler)是一種電腦程式,它會將某種程式語言寫成的源程式碼(原始語言)轉換成另一種程式語言(目標語言)。

編譯期都做了什麼?從我們使用者角度看無非就是把源程式碼編譯成了可被虛擬機執行的位元組碼,但是從平台(編譯器)角度看,它所經歷的流程還不少。
畢竟總不能給你什麼以.java為後綴的文件都進行編譯吧,需要有各種校驗解析步驟

2.1 解析與填充符號表

詞法語法分析

詞法分析

是指把源程式碼的字元流轉為標記(Token)集合,標記(Token)是編譯階段的最小單元,字元則是編程階段源碼的最小單元。
比如,int i = 0由4個標記構成分別是「int,i,=,0」編譯器只認識這些標記,詞法分析過程就是識別一個個標記的過程

語法分析

則是把生成的標記集合 構成一個語法樹,每個節點代表程式程式碼中的語法結構,如包,類型,修飾符,運算符等等。

填充符號表
通過了上面的詞義語義分析之後我們需要把數據存起來,以供後續流程使用,編譯器會以key-value的形式存儲數據,以符號地址為key符號資訊為value,具體形式沒做限制可以是樹狀符號表或者有序符號表等。
在語義分析中,根據符號表所登記的內容 語義檢查和產生中間程式碼,在目標程式碼生成階段,當對符號表進行地址分配時,該符號表是檢查的依據。

2.2 註解處理器

註解與普通的Java程式碼一樣,是在運行期間發揮作用的。我們可以把它看做是一組編譯器的插件,在這些插件裡面,可以讀取、修改、添加抽象語法樹中的任意元素。
如果這些插件在處理註解期間對語法樹進行了修改,編譯器將回到解析及填充符號表的過程重新處理,直到所有插入式註解處理器都沒有再對語法樹進行修改為止。
換句話說當我們處理註解時如果修改了語法樹的話會重新執行分析以及符號填充過程,把註解也填充進來,直到處理完所有註解。

2.3 語義分析

語法分析以及處理註解之後,編譯器獲得了程式程式碼的抽象語法樹,語法樹能表示一個結構正確的源程式的抽象,但無法保證源程式是符合邏輯的
說白了,語法樹上的內容單個來說是合法的但是結合到上下文語義則未必是合法的。

比如定義了兩個變數
int a = 1; boolean b = false; int c = a + b
以上 都能構成結構正確的語法樹,但是根據語義分析之後編譯是通不過,Java語言中是不合乎邏輯的。

2.4 解語法糖

Java 中最常用的語法糖主要有泛型、變長參數、條件編譯、自動拆裝箱、內部類等。虛擬機並不支援這些語法,它們在編譯階段就被還原回了簡單的基礎語法結構,這個過程成為解語法糖。

換句話說,不論你是否使用Java的語法糖,最終到jvm哪裡的時候都是一樣的,jvm不支援語法糖,所以需要編譯階段解語法糖,語法糖的初衷是用來提升開發效率,而不是程式碼性能。

2.5 位元組碼生成

位元組碼生成是Javac編譯過程的最後一個階段,在Javac源碼裡面由com.sun.tools.javac. jvm.Gen類來完成。位元組碼生成階段前面各個步驟所生成的資訊(語法樹、符號表)轉化成位元組碼寫到磁碟中,主要工作就是把語法樹和符號表加工成位元組碼文件。

3. 運行期間都做了什麼?

java的運行期主要是處理編譯器產生的位元組碼,包括載入與執行

3.1 載入器與驗證器

java提供類載入器把虛擬機外部的位元組碼資源載入到虛擬機的運行時環境(主要是指虛擬機的方法區)
並提供位元組碼驗證器來保證載入的位元組碼是安全合法的,對程式沒有危害的。

載入器 (Class Loader)

當位元組碼還沒被類載入器載入之前它目前還處於虛擬機外部存儲空間里,要想執行它需要通過類載入器來載入到虛擬機的運行時記憶體空間里。關於類載入器不太想過多擴展,有興趣珂查閱相關書籍資料。

常見類載入器有:

  • Bootstrap ClassLoader(啟動類載入器:載入位於lib 目錄下的類文件,如rt.jar
  • Extension ClassLoader(擴展類載入器): 載入位於libext目錄下的類文件
  • Application ClassLoader(應用程式類載入器):載入位於類路徑(ClassPath)下的類文件

總之,載入器的任務就是把位元組碼資源載入到虛擬機運行時環境里

位元組碼驗證 (Bytecode Verifier)

當類載入器將新載入的位元組碼呈現給虛擬機時,首先由驗證器來檢查驗證這些位元組碼。驗證程式檢查指令是否無法執行明顯有害的操作。除系統類之外的所有類都需要經過驗證。也可以使用命令-noverify選項來停用驗證。

位元組碼驗證器主要驗證如下幾項:

  • 變數在使用前初始化
  • 不違反訪問私有數據和方法的規則
  • 運行時堆棧不會溢出
  • 所有Java虛擬機指令的參數都是有效類型
  • 各種類型檢查

參考 http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10

總之,驗證器的任務就是保證載入器載入的位元組碼資源的安全性,正確性

3.2 解釋器與JIT編譯器

解釋器

解釋器(interpreter),是一種電腦程式,能夠把高級程式語言一行一行解釋 運行

劃重點:一行一行運行,說白了就是效率低

解釋器每次運行程式時都要一行一行先轉成另一種語言再作運行,因此解釋器的程式運行速度比較緩慢。它不會一次把整段程式碼翻譯出來,而是每翻譯一行程式敘述就立刻運行,然後再翻譯下一行,再運行,如此不停地進行下去。

JIT編譯器

即時編譯(Just-in-time compilation)是一種提高程式運行效率的方法。通常,程式在執行前全部被翻譯為機器碼。

Java最初的版本沒有JIT編譯器,完全靠解釋器來運行的,但是為了提升性能便引入了JIT編譯器,

重點說明:當我們說編譯的時候基本上指的是上面的從源碼到位元組碼的編譯過程,而不是指JIT編譯器

JIT編譯器工作階段基本是java程式運行期的最後階段了,它的工作是將載入的位元組碼轉換為機器碼。當使用JIT編譯器時,硬體可以執行JIT編譯器生成的機器碼,而不是讓JVM重複解釋執行相同的位元組碼導致相對冗長的翻譯過程。 這樣可以帶來執行速度的性能提升。

什麼時候觸發即時編譯?

  • 被多次調用的方法
  • 被多次執行的循環體

上面兩個條件又叫做熱點程式碼,至於如何界定這個多次或者熱點,Java提供了兩種策略:

熱點探測: 虛擬機定期檢查執行緒的棧頂,如果某個方法經常出現在棧頂 則推斷為熱點程式碼

計數器: 統計方法的調用次數,維護一個計數器列表

基於計數器來推斷熱點程式碼是HotSpot虛擬機採用的策略

通常情況下,解釋器和JIT編譯器混合配合工作,而不是單獨工作,這樣可以做到互補提升整體性能。HotSpot 虛擬機的解釋器JIT編譯器架構如下圖所示:

HotSpot虛擬機中內置了兩個即時編譯器,分別稱為Client Compiler和Server Compiler,或者簡稱為C1編譯器和C2編譯器,默認採用解釋器與其中一個編譯器直接配合的方式工作,程式使用哪個編譯器,取決於虛擬機運行的模式,用戶也可以使用「-client」或「-server」參數去強制指定虛擬機運行在Client模式或Server模式。

4. 總結

java 程式是如何運行的?

首先需要把源程式碼(高級語言) 編譯成虛擬機可執行的語言(位元組碼)
其次,需要把位元組碼解釋運行後者編譯成作業系統級別的機器語言,用於執行函數調用(System call)

Java是如何做到平台獨立的?

主要是因為位元組碼技術。我們可以把在Windows系統上編譯生成的位元組碼文件放在Linux系統上去執行,反之亦可。
虛擬機不在乎你是那個作業系統生成的位元組碼文件,他只在乎載入的這個.class位元組碼文件是否是正確的,安全的。

雖然Java語言是平台獨立的,但是虛擬機不行。每種作業系統都要下載對應的虛擬機,這主要是由於它最終調用的函數庫以及執行緒模型不同。

參考:

1.http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10.
2.深入理解Java虛擬機