前端基礎-HTML(meta標籤)

2020 年 4 月 7 日
筆記

meta標籤

1.編碼

示意圖

這種情況就是亂碼，是因為我們輸入的中文，往電腦中保存的時候，最終都要轉成2進位的數據形式，也就是說有一個編碼的過程，在保存文件的時候默認使用的是ANSI編碼格式，瀏覽器顯示文件中內容的時候，還需要將2進位的數據轉換成文字形式顯示出來，也就是說還有解碼的過程，瀏覽器被指定為utf-8格式來解碼，也就是說編碼和解碼不一致所造成的亂碼

解決亂碼示意圖

保存編碼圖示

我們加上meta標籤反而會亂碼的原因，是因為meta標籤可以指定瀏覽器解析文件的編碼格式，不加meta標籤反而會正常，是因為我們不指定解碼格式，瀏覽器會自動檢測編碼格式，再以對應的解碼方式進行解碼。

字符集的核心點就是如果設置了以什麼字符集進行讀取，那麼在保存的時候也需要設置成對應的字符集

<meta charset="utf-8">  <!--告知瀏覽器使用utf-8的編碼格式來解析頁面-->

知識小百科：

字符集

ansi：不同的國家和地區制定了不同的標準，由此產生了 GB2312、GBK、Big5、Shift_JIS 等各自的編碼標準。這些使用 1 至 4 個位元組來代表一個字元的各種漢字延伸編碼方式，稱為 ANSI 編碼。在簡體中文Windows作業系統中，ANSI 編碼代表 GBK 編碼；在日文Windows作業系統中，ANSI 編碼代表 Shift_JIS 編碼。不同 ANSI 編碼之間互不兼容，當資訊在國際間交流時，無法將屬於兩種語言的文字，存儲在同一段 ANSI 編碼的文本中。

unicode：Unicode（統一碼、萬國碼、單一碼）是電腦科學領域裡的一項業界標準，包括字符集、編碼方案等。Unicode 是為了解決傳統的字元編碼方案的局限而產生的，它為每種語言中的每個字元設定了統一併且唯一的二進位編碼，以滿足跨語言、跨平台進行文本轉換、處理的要求。

字元編碼

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字元編碼，又稱萬國碼，用在網頁上可以統一頁面顯示中文簡體繁體及其它語言（如英文，日文，韓文）。

GB2312是一個簡體中文字符集，由6763個常用漢字和682個全形的非漢字字元組成。其中漢字根據使用的頻率分為兩級。一級漢字3755個，二級漢字3008個。

GBK即漢字內碼擴展規範，K為擴展的漢語拼音中「擴」字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標準兼容GB2312，共收錄漢字21003個、符號883個，並提供1894個造字碼位，簡、繁體字融於一庫。

Big5 又稱為大五碼或五大碼**，是使用繁體中文（正體中文）社區中最常用的電腦漢字字符集標準，共收錄13,060個漢字。雖普及於中國台灣、中國香港與中國澳門等繁體中文通行區

2.給搜索引擎用

示意圖

多學一招：搜索引擎上的描述，可能是<meta>標籤中的description部分，也可能是頁面中的一段話