深入剖析PHP7內核源碼(一)- PHP架構與生命周期
- 2019 年 10 月 3 日
- 筆記
PHP7 為什麼這麼快?
- 全新的zval 更節約的空間,棧上分配內存
- zend_string 存儲字符串的Hash值,數組查詢的時候不需要進行Hash計算
- 在HashTable桶內直接存數據,減少了內存的申請次數,提升了cache命中率和內存訪問速度
- zend_parse_parameters改為了宏實現,性能提升5%
- 增加opcode指令 call_user_function,is_init/string/array,strlen,defined函數變成opcode指令,速度更快
- 排序算法的改進
PHP7 架構
- Zend 引擎:Zend引擎為PHP提供了基礎服務,包括詞法分析 語法分析 ,AST抽象語法樹編譯 opcodes執行,PHP的變量設計、內存管理、進程管理。
- PHP層:綁定了SAPI層並處理與它的通信,它同時對safe_mode和open_basedir的檢測提供一致的控制層,將fopen()、fread()和fwrite()等用戶空間的函數與文件和網絡I/O聯繫起來。
- SAPI:包括了cli fpm等,把接口對外接口都抽象出來,只要遵守SAPI協議便可以實現一個server。
- 拓展:zend 引擎提供了核心能力和接口規範,在此基礎上可以開發拓展
這裡的拓展分為了兩種,通常在php.ini中,通過extension=加載的擴展我們稱為PHP擴展,通過zend_extension=加載的擴展我們稱為Zend擴展,但從源碼的角度來講,PHP擴展應該稱為「模塊」(源碼中以module命名),而Zend擴展稱為「擴展」(源碼中以extension命名)。兩者最大的區別在於向引擎註冊的鉤子,向用戶層面提供一些C實現的PHP函數,需要用到zend_module_entry(即作為PHP擴展),而需要hook到Zend引擎的話,就得用到zend_extension(即作為Zend擴展)。
PHP7執行流程
- 詞法分析,把源代碼切割成多個字符串單元(Token)
- 語法分析器把Token轉換成AST抽象語法樹
- 抽象語法樹轉換成opcodes(opcode指令集合)
- 虛擬機解釋執行執行opcodes(opcode是一組指令標識,對應handler處理函數)
執行實例
詞法分析
<?php echo "Hello world";
切割成了4部分
<?php => #define T_OPEN_TAG 379 echo => #define T_ECHO 328 空格 => #define T_WHITESPACE 382 "hello world" => #define T_CONSTANT_ENCAPSED_STRING 323
語法分析
單獨存在的詞塊不能完整表達語義,還需要語法分析器,它會檢查語法,匹配Token,對Token進行關聯,組織串聯後的產物就是AST.AST 分為多種類型,對應PHP語法,比如賦值語句,生成的抽象語法樹節點是ZEND_AST_ASSIGN,賦值語句的左右會被作為ZEND_AST_ASSIGN類型節點的孩子(AST是PHP7才加入的,解耦了編譯器和解釋器).
opcodes
opcode是PHP執行過程中的中間代碼,生成後由虛擬機執行,生成的opcode是類似下面的樣子
line op 1 ECHO 2 RETURN
源碼中對應的opcode及handler
ZEND_ECHO // handler:ZEND_ECHO_SPEC_CONST_HANDLER 實現的功能是輸出"hello world" ZEND_RETURN // handler:ZEND_RETURN_SPEC_CONST_HANDLER
PHP 生命周期
CLI生命周期
- php_module_startup:註冊全局變量GPC等,加載內部拓展和外部拓展。
- php_request_startup:重置垃圾回收器,初始化執行器,初始化掃描器,設置超時時間等。
- php_execute_script
=> compile_file => open_file_for_scanning(讀取PHP代碼內容,並使詞法分析指針指向第一個位置) => zendparse(詞法分析語法分析後生成AST) => init_op_array(初始化op_array) => zend_compile_top_stmt(把AST轉為op_array) => pass_two(設置op_array對應的zend虛擬機handler) => 生成op_array => zend_execute(zend虛擬機中執行op_array)
- php_request_shutdown:調用所有關閉函數,調用所有析構函數,輸出緩衝區內容,重置最大執行時間,關閉輸出層(HTTP頭等),釋放所有request的全局變量
- php_module_shutdown:調用module對應的flush函數,清理持久化的符號表,銷毀全局變量,關閉所有拓展,關閉內存管理,關閉輸出output,析構垃圾回收
FPM模式的生命周期
- FPM跟CLI模式不同的是,FPM是常駐內存的,所以php_module_startup只在啟動進程的時候做一次初始化,對應的php_module_shutdown也只做一次。
- 進入循環,調用fcgi_accept_request(accept) 阻塞等待,如果請求進來,則進入php_request_startup,初始化請求,同時加了鎖來防止驚群效應
fcgi.c ... FCGI_LOCK(req->listen_socket); req->fd = accept(listen_socket, (struct sockaddr *)&sa, &len); FCGI_UNLOCK(req->listen_socket);
引用
- PHP7的性能優化總結 https://blog.csdn.net/eebaicai/article/details/83629547
- PHP擴展與Zend擴展區別 http://yangxikun.github.io/php/2016/07/10/php-zend-extension.html
- 《PHP7 底層設計與源碼實現》 陳雷等