前端開發需要了解的瀏覽器通識

瀏覽器通識

一、瀏覽器架構

1、單進程瀏覽器時代

2007年之前,市面上瀏覽器都是單進程的,在同一個進程里會存在網路、插件、JavaScript運行環境、渲染引擎和頁面等。
缺點

  1. 不穩定:一個節點崩潰,整個瀏覽器崩潰
  2. 不流暢:運行在同一個執行緒,需要重上到下一次完成
  3. 不安全:通過瀏覽器的漏洞來獲取系統許可權,可以對你的電腦做一些惡意的事情

2、多進程瀏覽器時代

新的Chrome瀏覽器包括:

  1. 1個瀏覽器(Browser)主進程:介面顯示、用戶交互、子進程管理,同時提供存儲等功能
  2. 1個 GPU 進程:UI介面都選擇採用GPU來繪製
  3. 1個網路(NetWork)進程:網路資源載入
  4. 多個渲染進程:將 HTML、CSS 和 JavaScript 轉換為用戶可以與之交互的網頁
  5. 多個插件進程:負責插件的運行
    瀏覽器是多進程的優點
  6. 一個頁面崩潰不會影響到整個瀏覽器
  7. 多進程可以充分利用現代 CPU 多核的優勢。
  8. 方便使用沙盒模型隔離插件等進程,提高瀏覽器的穩定性。

3、Chrome 打開一個頁面需要啟動多少進程?分別有哪些進程?

  • 打開 1 個頁面至少需要 1 個網路進程、1 個瀏覽器進程、1 個 GPU 進程以及 1 個渲染進程,共 4 個;
  • 最新的 Chrome 瀏覽器包括:1 個瀏覽器(Browser)主進程、1 個 GPU 進程、1 個網路(NetWork)進程、多個渲染進程和多個插件進程。

二、javascript單執行緒

1、為什麼採用單執行緒

主要用途是與用戶互動,以及操作DOM。如果JavaScript是多執行緒的,會帶來很多複雜的問題。
Web Worker:為 JavaScript 創造多執行緒環境,允許主執行緒創建 Worker 執行緒,將一些任務分配給後者運行。但是子執行緒完全受主執行緒控制,且不得操作DOM

2、瀏覽器內核中執行緒之間的關係

  1. GUI渲染執行緒和JS引擎執行緒互斥
  2. JS阻塞頁面載入:js如果執行時間過長就會阻塞頁面

3、進程和執行緒又是什麼呢

進程:是 CPU 資源分配的最小單位(是能擁有資源和獨立運行的最小單位)。
執行緒:是 CPU 調度的最小單位(是建立在進程基礎上的一次程式運行單位)。

4、任務隊列

JS 是單執行緒的,同步執行任務會造成瀏覽器的阻塞,所以我們將 JS 分成一個又一個的任務,通過不停的循環來執行事件隊列中的任務。

  • 單執行緒就意味著,所有任務都要排隊執行,前一個任務結束,才會執行後一個任務。
  • 如果當前執行緒空閑,並且隊列為空,那每次加入隊列的函數將立即執行。

三、渲染機制

1. 瀏覽器如何渲染網頁

瀏覽器渲染一共有五步

  1. 處理 HTML 並構建 DOM 樹。
  2. 處理 CSS構建 CSSOM 樹。
  3. 將 DOM 與 CSSOM 合併成一個渲染樹。
  4. 根據渲染樹來布局,計算每個節點的位置。
  5. 調用 GPU 繪製,合成圖層,顯示在螢幕上

第四步和第五步是最耗時的部分,這兩步合起來,就是我們通常所說的渲染

  1. 在構建 CSSOM 樹時,會阻塞渲染,直至 CSSOM樹構建完成
  2. 當 HTML 解析到 script 標籤時,會暫停構建 DOM,完成後才會從暫停的地方重新開始

四、快取機制

1、常見 http 快取的類型

  1. 私有/瀏覽器/本地快取
  2. 代理快取

2、快取的好處

  1. 減少了冗餘的數據傳輸,減少網費
  2. 減少伺服器端的壓力
    W3. eb 快取能夠減少延遲與網路阻塞,進而減少顯示某個資源所用的時間
  3. 加快客戶端載入網頁的速度

3、瀏覽器快取總結

瀏覽器快取分為強快取協商快取

強快取

對一個網站而言,CSS、JavaScript、圖片等靜態資源更新的頻率都比較低,而這些文件又幾乎是每次HTTP請求都需要的,如果將這些文件快取在瀏覽器中,可以極好的改善性能。

通過設置http頭中的cache-control和expires的屬性,可設定瀏覽器快取,將靜態內容設為永不過期,或者很長時間後才過期。

1、Cache-Control
Cache-Control屬性是在伺服器端配置的,不同的伺服器有不同的配置,apache、nginx、IIS、tomcat等配置都不盡相同。
以Apache為例,在http.conf中做如下配置:

<filesMatch 」.(jpg|jpeg|png|gif|ico)$」>
	Header set Cache Control max-age=16768000,public
</filesMatch>
<filesMatch 」.(css|js)$」>
	Header set Cache Control max-age=2628000,public
</filesMatch>

問題:瀏覽器快取的資源,若又想更新資源,如何實現?
解決:通過修改該資源的名稱來實現。修改了資源名稱,瀏覽器會當做不同的資源。
Cache-Control相關屬性
no-cache:不使用本地快取。
no-store:直接禁止遊覽器快取數據,
public:可以被所有的用戶快取,
private:只能被終端用戶的瀏覽器快取,
max-age:從當前請求開始,
must-revalidate,當快取過期時,

2、Expires
Expires屬性也是在服務端配置的,具體的配置也根據伺服器而定。
問題:可能存在客戶端時間跟服務端時間不一致的問題。
解決:建議Expires結合Cache-Control一起使用。

Cache-Control: public
Expires: Wed, Jan 10 2018 00:27:04 GMT

過程

  • 第一次瀏覽器發送請求給伺服器時,此時瀏覽器還沒有本地快取副本,伺服器返回資源給瀏覽器,響應碼是200 OK,瀏覽器收到資源後,把資源和對應的響應頭一起快取下來
  • 第二次瀏覽器準備發送請求給伺服器時候,瀏覽器會先檢查上一次服務端返回的響應頭資訊中的Cache-Control,它的值是一個相對值,單位為秒,表示資源在客戶端快取的最大有效期,過期時間為第一次請求的時間減去Cache-Control的值,過期時間跟當前的請求時間比較,如果本地快取資源沒過期,那麼命中快取,不再請求伺服器
  • 如果沒有命中,瀏覽器就會把請求發送給伺服器,進入快取協商階段。

協商快取

覽器在第一次訪問頁面時向伺服器請求資源,並快取起來,下次再訪問時會判斷在快取中是否已有該資源且有沒有更新過,如果已有該資源且未更新過,則直接從瀏覽器快取中讀取。

原理:
通過HTTP 請求頭中的 If-Modified-Since(If-No-Match) 和響應頭中的Last-Modified(ETag)來實現
HTTP請求把 If-Modified-Since(If-No-Match)傳給伺服器
伺服器將其與Last-Modified(ETag)對比,若相同,則文件沒有被改動過,則返回304,直接瀏覽器快取中讀取資源即可。

快取位置

  • Service Worker
  • Memory Cache
  • Disk Cache
  • Push Cache

Service Worker

離線快取: 這個應用場景比如PWA,它借鑒了Web Worker思路,由於它脫離了瀏覽器的窗體,因此無法直接訪問DOM。它能完成的功能比如:離線快取、消息推送和網路代理,其中離線快取就是Service Worker Cache。

Memory Cache

記憶體快取:從效率上講它是最快的,從存活時間來講又是最短的,當渲染進程結束後,記憶體快取也就不存在了。

Disk Cache

存儲在磁碟中的快取:從存取效率上講是比記憶體快取慢的,優勢在於存儲容量和存儲時長。

Push Cache

推送快取:這算是瀏覽器中最後一道防線吧,它是HTTP/2的內容

六、瀏覽器存儲

  1. 短暫性存儲:我們只需要將數據存在記憶體中,只在運行時可用
  2. 持久性存儲:可以分為 瀏覽器端 與 伺服器端
    • 瀏覽器:
      1. cookie: 通常用於存儲用戶身份,登錄狀態等
      2. localStorage / sessionStorage: 長久儲存/窗口關閉刪除, 體積限制為 4~5M
      3. indexDB:瀏覽器提供的本地資料庫
    • 伺服器:
      1. 分散式快取 redis
      2. 資料庫

存儲大小:
cookie數據大小不能超過4k
sessionStorage和localStorage雖然也有存儲大小的限制,但比cookie大得多,可以達到5M或更大

有效期時間:
localStorage 存儲持久數據,瀏覽器關閉後數據不丟失除非主動刪除數據
sessionStorage 數據在當前瀏覽器窗口關閉後自動刪除
cookie 設置的cookie過期時間之前一直有效,即使窗口或瀏覽器關閉

七、跨域處理方案

九種實用的前端跨域處理方案

八、安全

網站安全問題匯總

九、PWA漸進式web應用–離線存儲

PWA漸進式web應用

十、DOM節點操作

JavaScript之BOM和DOM及其兼容操作詳細總結
(1)創建新節點

createDocumentFragment()    //創建一個DOM片段
createElement()   //創建一個具體的元素
createTextNode()   //創建一個文本節點

(2)添加、移除、替換、插入

appendChild(node)
removeChild(node)
replaceChild(new,old)
insertBefore(new,old)

(3)查找

getElementById();
getElementsByName();
getElementsByTagName();
getElementsByClassName();
querySelector();
querySelectorAll();

(4)屬性操作

getAttribute(key);
setAttribute(key, value);
hasAttribute(key);
removeAttribute(key);

十一、頁面載入過程

  1. 當我們打開網址的時候,瀏覽器會從伺服器中獲取到 HTML 內容

  2. 瀏覽器獲取到 HTML 內容後,就開始從上到下解析 HTML 的元素

  3. <head>元素內容會先被解析,此時瀏覽器還沒開始渲染頁面

  4. 當瀏覽器解析到這裡時(步驟 3),會暫停解析並下載 JavaScript 腳本

  5. 當 JavaScript 腳本下載完成後,瀏覽器的控制權轉交給 JavaScript 引擎。當腳本執行完成後,控制權會交回給渲染引擎,渲染引擎繼續往下解析 HTML 頁面

  6. 此時<body>元素內容開始被解析,瀏覽器開始渲染頁面]

js延遲載入的方式有哪些

  1. 將 js 腳本放在文檔的底部,來使 js 腳本儘可能的在最後來載入執行
  2. 給 js 腳本添加 defer 屬性,這個屬性會讓腳本的載入與文檔的解析同步解析,然後在文檔解析完成後再執行這個腳本文件,這樣的話就能使頁面的渲染不被阻塞。多個設置了 defer 屬性的腳本按規範來說最後是順序執行的,但是在一些瀏覽器中可能不是這樣
  3. 給 js 腳本添加 async屬性,這個屬性會使腳本非同步載入,不會阻塞頁面的解析過程,但是當腳本載入完成後立即執行 js腳本,這個時候如果文檔沒有解析完成的話同樣會阻塞。多個 async 屬性的腳本的執行順序是不可預測的,一般不會按照程式碼的順序依次執行
  4. 動態創建 DOM 標籤的方式,我們可以對文檔的載入事件進行監聽,當文檔載入完成後再動態的創建 script 標籤來引入 js 腳本

十二、輸入url到展示過程

基礎版本

  • 瀏覽器根據請求的URL交給DNS域名解析,找到真實IP,向伺服器發起請求;
  • 伺服器交給後台處理完成後返回數據,瀏覽器接收文件(HTML、JS、CSS、圖象等);
  • 瀏覽器對載入到的資源(HTML、JS、CSS等)進行語法解析,建立相應的內部數據結構(如HTML的DOM);
  • 載入解析到的資源文件,渲染頁面,完成。
  1. 從瀏覽器接收url到開啟網路請求執行緒(這一部分可以展開瀏覽器的機制以及進程與執行緒之間的關係)

  2. 開啟網路執行緒到發出一個完整的HTTP請求(這一部分涉及到dns查詢,TCP/IP請求,五層網際網路協議棧等知識)

  3. 從伺服器接收到請求到對應後台接收到請求(這一部分可能涉及到負載均衡,安全攔截以及後台內部的處理等等)

  4. 後台和前台的HTTP交互(這一部分包括HTTP頭部、響應碼、報文結構、cookie等知識,可以提下靜態資源的cookie優化,以及編碼解碼,如gzip壓縮等)

  5. 單獨拎出來的快取問題,HTTP的快取(這部分包括http快取頭部,ETag,catch-control等)

  6. 瀏覽器接收到HTTP數據包後的解析流程(解析html-詞法分析然後解析成dom樹、解析css生成css規則樹、合併成render樹,然後layout、painting渲染、複合圖層的合成、GPU繪製、外鏈資源的處理、loaded和DOMContentLoaded等)

  7. CSS的可視化格式模型(元素的渲染規則,如包含塊,控制框,BFC,IFC等概念)

  8. JS引擎解析過程(JS的解釋階段,預處理階段,執行階段生成執行上下文,VO,作用域鏈、回收機制等等)

  9. 其它(可以拓展不同的知識模組,如跨域,web安全,hybrid模式等等內容)