Apache(httpd)詳解
思維導圖
1. httpd服務
1.1 httpd概述
ASF(Apache Software Foundation)
1)服務器的類型
- http服務器(httpd,nginx,Lighttpd)
- 應用程序服務器(IIS:.NET ,tomcat:.JSP)
2)httpd的特性
高度模塊化(Core+modules)
DSO機制(Dynamic Shared Object ,動態共享對象)
MPM(Multipath Procession Modules,多路處理模塊)
- 可以通過修改MPM來修改並發響應模型
- 2.4支持MPM模塊動態切換,2.2不支持
3)httpd的並發響應模型
- prefork:兩級進程模型,父進程管理子進程,每個進程響應一個請求
# 工作模型 一個主進程: 負責生成子進程及回收子進程 負責創建套接字、接受請求,並將其派發給某子進程進行處理 n個子進程: 每個子進程處理一個請求 # 注意: 會預先生成幾個空閑進程,隨時等待用於響應用戶請求 最大空閑和最小空閑
- worker:三級進程模型,父進程管理子進程,子進程通過線程響應用戶請求,每個線程處理一個用戶請求
# 工作模型 一個主進程: 負責生成子進程、創建套接字、接受請求,並將其派發給某子進程進行處理 多個子進程: 每個子進程負責生成多個線程 每個線程: 負責響應用戶請求 # 並發響應數量: 子進程數 * 每個子進程能創建的最大線程數
- event:兩級模型,父進程管理子進程,子進程通過事件驅動event-driven機制直接響應n個請求
# 工作模型: 一個主進程: 負責生成子進程、創建套接字、接受請求,並將其派發給某子進程進行處理 子進程: 基於事件驅動機制直接響應多個請求 # httpd-2.4中的event機制可以在生產環境中使用
2.2 httpd的程序結構
- httpd2.2(CentOS6中)
- httpd2.4(CentOS7及以上)
3. httpd的主配置文件
3.1 配置文件結構和格式
1)整體結構
全局環境配置(Global Environment):對進程自己的工作特點,對所有虛擬主機都通用的設定
主服務器配置段(「Main」 server configuration):在2.2上如果要使用主服務器,則要將虛擬主機關掉
虛擬主機(Virtual Hosts)
2)配置格式:directive value
- directive,不區分字符大小寫
- value,為路徑時,是否區分字符大小寫,取決於文件系統
3.2 監聽的IP和PORT
# 格式: Listen [IP:]Port [protocol] # 若省略IP則表示0.0.0.0 # Listen指令可以重複出現多次 Listen 80 Listen 8080 # 注意: 修改監聽的套接字,重啟服務進程才能生效 限制其必須通過ssl通信時,protocol需要定義為https
3.3 用戶和用戶組
# 作用: 指定以哪個用戶的身份運行httpd服務器進程 # 格式: User apache Group apache # 對主控進程是root用戶的說明: 主控進程是root,因為80端口是特權端口(小於1024的端口),只有管理員才能使用 所以主控進程是root,而其他的進程使用普通用戶權限 SUexec在某些指令執行時可以切換到另外一個用戶(默認沒有裝載)
3.4 默認字符集
# 設置默認字符集 # 格式 AddDefaultCharset UTF-8 # 中文字符集: GBK、GB2312、GB18030
3.5 站點主頁面
# 格式: DirectoryIndex index.html index.html.var
3.6 持久連接
# 持久連接 Persistent Connection 保持連接,長連接 tcp連接建立後,每個資源獲取完成後不斷開連接,而是繼續等待其他資源請求的進行 # 斷開條件 1. 數量限制 2. 時間限制 # 副作用 對並發訪問量較大的服務器,長連接機制會使得後續某些請求無法得到正常響應 # 折中方案 1. 使用較短的持久連接時長 2. 限制較少的請求數量 # 配置 KeepAlive On | Off # 是否啟用長連接 KeepAliveTimeout 15 # 超時時長,單位為秒 MaxKeepAliveRequests 100 #保持連接上面所能獲取的最大請求數量(每個連接上面的最大請求數量) # 注意 httpd2.4的KeepAliveTimeout可以是毫秒級,如果要設置毫秒級,可以直接在數值後面加上ms表示毫秒
- 可以用telnet命令來對持久連接進行測試
telnet 10.0.0.110 80
GET / HTTP/1.1
Host: 10.0.0.110
3.7 配置MPM
1)說明
在2.2中(CentOS6的rpm包)專門提供了三個應用程序文件;因為httpd2.2不支持通過編譯多個MPM模塊,所以只能編譯選定要使用的那個;
這三個應用程序文件分別用於實現對不同的MPM機制的支持,默認是使用prefork機制
- httpd(prefork)默認就是使用prefork機制
- httpd.worker
- httpd.event
2)查看httpd程序的模塊列表
# 查看httpd程序的模塊列表 # 查看靜態編譯的模塊 httpd -l # 查看靜態編譯及動態編譯的模塊,查看所有模塊 httpd -M
3)切換MPM機制
### 2.2中 # 1.更換使用的httpd程序,以支持其他MPM機制 vim /etc/sysconfig/httpd HTTPD=/usr/sbin/httpd.{worker,event} # 2.然後啟用的時候要使用/usr/sbin/httpd.worker /usr/sbin/httpd.worker -k start ### 2.4中 # 直接在這個文件中將對應的模塊取消注釋就ok vim /etc/httpd/conf.modules.d/00-mpm.conf # 查看當前的工作模式 httpd -V # 注意:重啟服務方可生效
4)MPM的配置
# prefork的配置: <IfModule prefork.c> StartServers 8 # httpd服務進程啟用以後自動創建出空閑的子進程數量 MinSpareServers 5 # 最少空閑進程數,無論如何都需要有5個空閑進程來對待新請求 MaxSpareServers 20 # 最大空閑進程數,要大於StartServers的數量 ServerLimit 256 # 同時在生命周期內處於活躍狀態的服務器進程數(跟MaxClients應該是相同的) MaxClients 256 # 最大允許啟動的服務器子進程的數量 MaxRequestsPerChild 4000 # 一個子進程最多能處理的請求,若超過這個值,就將這個進程kill掉而創建新的進程 # 設置為0則表示永不過期 </IfModule> # worker的配置: <IfModule worker.c> StartServers 4 # httpd服務進程啟動以後自動創建出空閑的子進程數量 MinSpareThreads 25 # 最少空閑的線程數 MaxSpareThreads 75 # 最大空閑的線程數 MaxClients 300 # 最大的允許在線的線程數 ThreadsPerChild 25 # 每個子進程生成多少個線程 MaxRequestsPerChild 0 # 單個進程最大允許響應多少個請求 <IfModule>
3.8 模塊加載
# DSO動態共享對象 # 模塊位置 /etc/httpd/conf.modules.d/ 在這個目錄下的模塊對應的配置文件中修改 # 加載模塊 LoadModule <mod_name> <mod_path> 模塊文件路徑可使用相對路徑,相對於ServerRoot,默認是 /etc/httpd
3.9 定義Main Server
# 定義Main Server ServerName FQDN # 語法格式 ServerName [scheme://]fully-qualified-domain-name[:port] # 此處的名字是用來表示當前主機認為主機主要是服務於誰的 # 如果這條指令沒有定義,那麼httpd啟動時會試圖反解本地的IP地址(把IP解析為主機名),如果解析不成功,則會警告 DocumentRoot "/var/www/html" # 作用:指明網站的站點的url映射到本地的哪個文件系統路徑下 # 文檔路徑映射: # DocumentRoot指向的路徑為URL路徑的起始位置,其相當於站點URL的根路徑 # URL PATH與FileSystem PATH不是等同的,而是存在一種映射關係
3.10 路徑別名
# 格式: Alias /URL/ "/PATH/TO/SOMEDIR" # 把URL跟另外的其他的目錄建立映射關係 # 注意:在httpd2.4中要對那個目錄進行顯示授權(在Directory中定義那個目錄的權限)
- Alias和DocumentRoot的區別:
DocumentRoot "/www/htdocs"
//www.hgzero.com/download/xxx.txt
/www/htdocs/download/xxx.txt
Alias /download/ "/doc/pub/"
//www.hgzero.com/download/xxx.txt
/doc/pub/xxx.txt
3.11 站點訪問控制
# 文件系統路徑: <Directory ""> # 對目錄下的所有資源進行控制 ... </Directory> <File ""> # 針對某個文件進行控制 ... </File> <FileMatch "PATTERN"> # 針對符合正則匹配的所有文件進行控制 ... </FileMatch> # URL路徑: <Location ""> # 針對URL路徑進行控制 ... </Location> <LocationMatch ""> ... </LocationMatch>
3.12 status頁面
在2.4上面要裝載的模塊:LoadModule status_module modules/mod_status.so
# 在httpd2.2中: <Location /server-status> SetHandler server-status Order allow,deny Allow from 172.16 </Location> # 在httpd2.4中: <Location /server-status> SetHandler server-status <RequireAll> Require ip 172.16 </RequireAll> </Location>
3.13 頁面壓縮deflate
1)作用
- 使用mod_deflate模塊壓縮頁面優化傳輸速度(壓縮文本文件,圖片文件不需要壓縮)
2)適用場景
- 節約帶寬,額外消耗CPU;同時,可能有些較老瀏覽器不支持
- 壓縮適於壓縮的資源,例如文件文件
3)設置示例
SetOutputFilter DEFLATE # 設置一個叫DEFLATE的過濾器 # mod_deflate configuration # Restrict compression to these MIME types # 指定對哪些內容做壓縮 AddOutputFilterByType DEFLATE text/plain AddOutputFilterByType DEFLATE text/html AddOutputFilterByType DEFLATE application/xhtml+xml AddOutputFilterByType DEFLATE text/xml AddOutputFilterByType DEFLATE application/xml AddOutputFilterByType DEFLATE application/x-javascript AddOutputFilterByType DEFLATE text/javascript AddOutputFilterByType DEFLATE text/css # Level of compression (Highest 9 - Lowest 1) # 指定壓縮比 DeflateCompressionLevel 9 # Netscape 4.x has some problems. # 匹配特定的瀏覽器,再對其做特定的壓縮,因為可能有些瀏覽器的特性不一樣,如IE BrowserMatch ^Mozilla/4 gzip-only-text/html # Netscape 4.06-4.08 have some more problems BrowserMatch ^Mozilla/4\.0[678] no-gzip # MSIE masquerades as Netscape, but it is fine BrowserMatch \bMSI[E] !no-gzip !gzip-only-text/html
4. 虛擬主機
4.1 虛擬主機概述
1)站點標識(IP、PORT、FQDN)
- IP相同,端口不同
- IP不同,端口均為默認端口
- FQDN不同:http請求報文首部中 Host:www.hgzero.com
2)虛擬主機種類
- 基於IP地址:為每個虛擬主機準備至少一個ip地址,默認是匹配自上而下的第一個符合條件的
- 基於端口PORT:為每個虛擬主機使用至少一個獨立的port
- 基於FQDN:為每個虛擬主機使用至少一個FQDN
- 基於FQDN時,要將所有的FQDN都解析到同一個IP地址上
- 可以在本地hosts文件中定義或者在DNS服務器上指定
- 基於FQDN時,是根據http請求報文中的host值來判斷的,這個host值是不會被解析的
4.2 匹配規則&匹配格式
1)匹配規則
- 通配的越少的虛擬主機,匹配優先級越高
- 如果基於名稱的虛擬主機無法匹配上,則採用虛擬主機列表中的第一個虛擬主機作為響應主機
- 如果所有的虛擬主機都無法匹配上,則採用主配置段中的主機,如果主配置段中注釋了DocumentRoot,則返回對應的錯誤
注意:
- 一般虛擬主機不要與中心主機混用,如果要使用虛擬主機,得先禁用main主機;2.4則可以不禁Main Server
- 禁用中心主機:注釋DocumentRoot即可
2)虛擬主機配置格式
<VirtualHost IP:PORT>
ServerName FQDN
DocumentRoot ""
...
ServerAlias:虛擬主機的別名,可多次使用
</VirtualHost>
4.3 虛擬主機配置示例
1)基於IP的虛擬主機(基於端口)
# 基於IP的虛擬主機(基於端口的虛擬主機無非就是IP地址相同,而端口不同而已): <VirtualHost 10.0.0.201:81> ServerName www.hgzero.com DocumentRoot "/data/html/www" <Directory "/data/html/www"> Options None AllowOverride None Require all granted </Directory> CustomLog "/data/html/www/log/access_log" combined </VirtualHost> <VirtualHost *:82> # 這裡的*表示監聽本地所有地址 ServerName bbs.hgzero.com DocumentRoot "/data/html/bbs" <Directory "/data/html/bbs"> Options None AllowOverride None Require all granted </Directory> CustomLog "/data/html/bbs/log/access_log" combined </VirtualHost>
2)基於FQDN的虛擬主機
# 基於主機名(FQDN) <VirtualHost *:80> ServerName web.hgzero.com DocumentRoot "/data/html/www" <Directory "/data/html/www"> Options None AllowOverride None Require all granted </Directory> CustomLog "/data/html/www/log/access_log" combined </VirtualHost> <VirtualHost *:80> ServerName bbs.hgzero.com DocumentRoot "/data/html/bbs" <Directory "/data/html/bbs"> Options None AllowOverride None Require all granted </Directory> CustomLog "/data/html/bbs/log/access_log" combined </VirtualHost> # 注意:如果是在http2.2上,則使用基於FQDN的虛擬主機時,要事先使用如下指令 NameVirtualHost 172.16.100.6:80 # 意為在這個IP和端口上,開放基於主機名的虛擬主機
3)注意
基於名稱的虛擬主機必須指定ServerName指令,否則它將會繼承操作系統的FQDN
對於基於名稱的虛擬主機,如果使用IP地址請求無法匹配到任何虛擬主機時,將採用第一個虛擬主機作為默認虛擬主機
5. 訪問控制
5.1 基於源地址的訪問控制
1)httpd2.2和httpd2.4中的訪問控制
### httpd-2.2 ### AllowOverride # 表示是否允許覆蓋這裡的配置;與訪問控制相關的指令可以放在.htaccess文件中 All None order # 定義生效次序,寫在後面的表示默認法則 allow deny Allow from # 允許哪些地址的訪問 Deny from #拒絕哪些地址的訪問
### httpd-2.4 ### # 基於IP控制 Require ip IP_ADDR Require not ip IP_ADDR # 基於主機名控制 Require host 主機名或域名 Require not host 主機名或域名 ### 注意: # 以上的這些控制信息需要定義在<RequireAll>...</RequireAll>中或<RequireAny>配置塊中 # 2.4中的源地址的訪問控制需要顯示指定
2)Options選項
Indexes # 指明的URL路徑下不存在與定義的主頁面資源相等的資源文件時,返回索引列表給用戶 FollowSymLinks # 允許跟蹤符號鏈接文件所指向的源文件(在配置別名時很有用) None All
3)httpd2.4中的配置示例
### 配置示例 <Directory "/var/www/html/bbs"> Options None AllowOverride None <RequireAll> # 這裡定義了基於IP的訪問控制(這裡也可以緩存域名或主機名) Require ip 192.168.0.0/16 Require not ip 192.168.1.102 </RequireAll> </Directory> ### 來源地址的格式:如果是基於主機名的話,要寫成Requrie host node1.com IP NetAddr: 172.16 172.16.0.0/16 172.16.0.0/255.255.0.0
5.2 控制頁面允許or不允許所有主機訪問
# 控制頁面資源允許所有來源的主機可訪問: # http-2.2 <Directory ""> ... Order allow,deny Allow from all </Directory> # http-2.4 <Directory ""> ... Require all granted </Directory> # 控制頁面資源拒絕所有來源的主機可訪問: # http-2.2 <Directory ""> ... Order allow,deny Deny from all </Directory> # http-2.4 <Directory ""> ... Require all denied </Directory>
5.3 htpasswd
5.4 基於用戶的訪問控制
1)認證概述
# 認證質詢 WWW-Authenticate,響應碼為401,拒絕客戶端請求,並說明要求客戶端提供賬號和密碼 客戶端用戶填入賬號和密碼後再次發送請求報文,若認證通過,則服務器發送響應的資源 # 認證方式 basic:明文 digest:消息摘要認證 表單認證 # 安全域 需要用戶認證後方能訪問的路徑 應該通過名稱對其特性標識,以便告知用戶認證的原因 # 用戶的賬號和密碼存放的位置 虛擬賬號:僅用於訪問某服務時用到的認證標識 存儲: 文本文件 SQL數據庫 ldap目錄存儲
2)basic認證配置示例
- 基於用戶的認證:
# 定義安全域: <Directory ""> Options None AllowOverride None # 是否允許覆蓋這裡的配置,一般都是設置為None AuthType Basic # 也可以指明digest認證方式 AuthName "String" # 指明提示信息 AuthUserFile "/etc/httpd/conf.d/.htpasswd" # 密碼文件,最好將其設置為隱藏文件 Require user username1 username2 ... # 允許登錄的用戶 Require valid-user # 允許賬號文件中的所有用戶登錄訪問 </Directory>
- 基於組賬號進行認證:
# 定義安全域: <Directory ""> Options None AllowOverride None AuthType Basic AuthName "String" AuthUserFile "PATH/TO/HTTPD_USER_PASSWD_FILE" AuthGroupFile "/PATH/TO/HTTPD_GROUP_FILE" # 這裡引用的是組賬號的文件 Require group groupname1 grpname2 ... # 允許登錄的組 </Directory> # 創建用戶賬號和組賬號文件: # 組賬號定義格式: 組文件:每一行定義一個組(創建組賬號文件) GRP_NAME:username1 username2 ...
6. https的配置
6.1 https的工作流程
1)SSL會話過程
2)SSL會話緩存
- SSL會話的時長
- 若每次通信都經過ssl handshake,那將是非常浪費資源的,所以Server端可以吧ssl會話給緩存下來
- 在一段時間內同一客戶端訪問時這個ssl handshake過程就不必再做了,直接利用此前已經建立的會話資源就可以了
- 但是此會話不能保存太長時間,一般是五分鐘之內都是有效的
- SSL會話是基於IP地址創建的,所以單IP的主機上,僅可以使用一個https的虛擬主機
6.2 配置httpd支持https
7. 日誌相關
7.1 日誌的記錄
7.2 日誌輪替
- cronolog
- rotatelog
8. 壓測工具
9. httpd自帶的工具程序
- apachectl
- apxs
- suexec
10. LAMP基本架構