關於Python中html實體轉義與非轉義[還原]

  • 2019 年 11 月 13 日
  • 筆記

介紹

何為HTML實體?

在HTML中,某些字元是預留的,用來編寫HTML程式碼的。所以這時程式設計師就不能直接使用他們。

比如:< 和 >。<>是HTML最常用的兩個字元,程式設計師想要使用他們本身,必須用HTML實體。

更多HTML實體,請參考:https://www.w3school.com.cn/html/html_entities.asp

Python處理實體

那麼Python中如何處理HTML實體呢?

我這裡是Python3.7

html庫,該庫自帶。

值得一說的是,Python2中反轉義庫是:HTMLParser

轉義

import html    print(html.escape('username=wudao&password=123'))    # username=wudao&amp;password=123

反轉義

import html    print(html.unescape('username=wudao&amp;password=123'))  # username=wudao&password=123