前端基礎-HTML(meta標籤)
- 2020 年 4 月 7 日
- 筆記
meta標籤
1.編碼
示意圖 |
---|
|

這種情況就是亂碼,是因為我們輸入的中文,往電腦中保存的時候,最終都要轉成2進位的數據形式,也就是說有一個編碼的過程,在保存文件的時候默認使用的是ANSI編碼格式,瀏覽器顯示文件中內容的時候,還需要將2進位的數據轉換成文字形式顯示出來,也就是說還有解碼的過程,瀏覽器被指定為utf-8格式來解碼,也就是說編碼和解碼不一致所造成的亂碼
解決亂碼示意圖 |
---|
|

保存編碼圖示 |
---|
|

我們加上meta標籤反而會亂碼的原因,是因為meta標籤可以指定瀏覽器解析文件的編碼格式,不加meta標籤反而會正常,是因為我們不指定解碼格式,瀏覽器會自動檢測編碼格式,再以對應的解碼方式進行解碼。
字符集的核心點就是如果設置了以什麼字符集進行讀取,那麼在保存的時候也需要設置成對應的字符集
<meta charset="utf-8"> <!--告知瀏覽器使用utf-8的編碼格式來解析頁面-->
知識小百科:
字符集
ansi:不同的國家和地區制定了不同的標準,由此產生了 GB2312、GBK、Big5、Shift_JIS 等各自的編碼標準。這些使用 1 至 4 個位元組來代表一個字元的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡體中文Windows作業系統中,ANSI 編碼代表 GBK 編碼;在日文Windows作業系統中,ANSI 編碼代表 Shift_JIS 編碼。 不同 ANSI 編碼之間互不兼容,當資訊在國際間交流時,無法將屬於兩種語言的文字,存儲在同一段 ANSI 編碼的文本中。
unicode:Unicode(統一碼、萬國碼、單一碼)是電腦科學領域裡的一項業界標準,包括字符集、編碼方案等。Unicode 是為了解決傳統的字元編碼方案的局限而產生的,它為每種語言中的每個字元設定了統一併且唯一的二進位編碼,以滿足跨語言、跨平台進行文本轉換、處理的要求。
字元編碼
UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼,用在網頁上可以統一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。
GB2312是一個簡體中文字符集,由6763個常用漢字和682個全形的非漢字字元組成。其中漢字根據使用的頻率分為兩級。一級漢字3755個,二級漢字3008個。
GBK即漢字內碼擴展規範,K為擴展的漢語拼音中「擴」字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標準兼容GB2312,共收錄漢字21003個、符號883個,並提供1894個造字碼位,簡、繁體字融於一庫。
Big5 又稱為大五碼或五大碼**,是使用繁體中文(正體中文)社區中最常用的電腦漢字字符集標準,共收錄13,060個漢字。雖普及於中國台灣、中國香港與中國澳門等繁體中文通行區
2.給搜索引擎用
示意圖 |
---|
|

多學一招:搜索引擎上的描述,可能是<meta>
標籤中的description部分,也可能是頁面中的一段話