深入剖析PHP7內核源碼(一)- PHP架構與生命周期

  • 2019 年 10 月 3 日
  • 筆記

PHP7 為什麼這麼快?

  • 全新的zval 更節約的空間,棧上分配內存
  • zend_string 存儲字符串的Hash值,數組查詢的時候不需要進行Hash計算
  • 在HashTable桶內直接存數據,減少了內存的申請次數,提升了cache命中率和內存訪問速度
  • zend_parse_parameters改為了宏實現,性能提升5%
  • 增加opcode指令 call_user_function,is_init/string/array,strlen,defined函數變成opcode指令,速度更快
  • 排序算法的改進

PHP7 架構

  • Zend 引擎:Zend引擎為PHP提供了基礎服務,包括詞法分析 語法分析 ,AST抽象語法樹編譯 opcodes執行,PHP的變量設計、內存管理、進程管理。
  • PHP層:綁定了SAPI層並處理與它的通信,它同時對safe_mode和open_basedir的檢測提供一致的控制層,將fopen()、fread()和fwrite()等用戶空間的函數與文件和網絡I/O聯繫起來。
  • SAPI:包括了cli fpm等,把接口對外接口都抽象出來,只要遵守SAPI協議便可以實現一個server。
  • 拓展:zend 引擎提供了核心能力和接口規範,在此基礎上可以開發拓展

這裡的拓展分為了兩種,通常在php.ini中,通過extension=加載的擴展我們稱為PHP擴展,通過zend_extension=加載的擴展我們稱為Zend擴展,但從源碼的角度來講,PHP擴展應該稱為「模塊」(源碼中以module命名),而Zend擴展稱為「擴展」(源碼中以extension命名)。兩者最大的區別在於向引擎註冊的鉤子,向用戶層面提供一些C實現的PHP函數,需要用到zend_module_entry(即作為PHP擴展),而需要hook到Zend引擎的話,就得用到zend_extension(即作為Zend擴展)。

PHP7執行流程

  1. 詞法分析,把源代碼切割成多個字符串單元(Token)
  2. 語法分析器把Token轉換成AST抽象語法樹
  3. 抽象語法樹轉換成opcodes(opcode指令集合)
  4. 虛擬機解釋執行執行opcodes(opcode是一組指令標識,對應handler處理函數)

執行實例

詞法分析
<?php  echo "Hello world";

切割成了4部分

<?php  => #define T_OPEN_TAG 379    echo => #define T_ECHO 328    空格 =>  #define T_WHITESPACE 382    "hello world" => #define T_CONSTANT_ENCAPSED_STRING 323  
語法分析

單獨存在的詞塊不能完整表達語義,還需要語法分析器,它會檢查語法,匹配Token,對Token進行關聯,組織串聯後的產物就是AST.AST 分為多種類型,對應PHP語法,比如賦值語句,生成的抽象語法樹節點是ZEND_AST_ASSIGN,賦值語句的左右會被作為ZEND_AST_ASSIGN類型節點的孩子(AST是PHP7才加入的,解耦了編譯器和解釋器).

opcodes

opcode是PHP執行過程中的中間代碼,生成後由虛擬機執行,生成的opcode是類似下面的樣子

line     op  1        ECHO  2        RETURN

源碼中對應的opcode及handler

ZEND_ECHO // handler:ZEND_ECHO_SPEC_CONST_HANDLER 實現的功能是輸出"hello world"  ZEND_RETURN  // handler:ZEND_RETURN_SPEC_CONST_HANDLER

PHP 生命周期

CLI生命周期

  • php_module_startup:註冊全局變量GPC等,加載內部拓展和外部拓展。
  • php_request_startup:重置垃圾回收器,初始化執行器,初始化掃描器,設置超時時間等。
  • php_execute_script
=> compile_file  => open_file_for_scanning(讀取PHP代碼內容,並使詞法分析指針指向第一個位置)  => zendparse(詞法分析語法分析後生成AST) => init_op_array(初始化op_array)  => zend_compile_top_stmt(把AST轉為op_array)  => pass_two(設置op_array對應的zend虛擬機handler)  => 生成op_array  => zend_execute(zend虛擬機中執行op_array)
  • php_request_shutdown:調用所有關閉函數,調用所有析構函數,輸出緩衝區內容,重置最大執行時間,關閉輸出層(HTTP頭等),釋放所有request的全局變量
  • php_module_shutdown:調用module對應的flush函數,清理持久化的符號表,銷毀全局變量,關閉所有拓展,關閉內存管理,關閉輸出output,析構垃圾回收

FPM模式的生命周期

  • FPM跟CLI模式不同的是,FPM是常駐內存的,所以php_module_startup只在啟動進程的時候做一次初始化,對應的php_module_shutdown也只做一次。
  • 進入循環,調用fcgi_accept_request(accept) 阻塞等待,如果請求進來,則進入php_request_startup,初始化請求,同時加了鎖來防止驚群效應
fcgi.c  ...  FCGI_LOCK(req->listen_socket);  req->fd = accept(listen_socket, (struct sockaddr *)&sa, &len);  FCGI_UNLOCK(req->listen_socket);

引用