关于Python中html实体转义与非转义[还原]

  • 2019 年 11 月 13 日
  • 筆記

介绍

何为HTML实体?

在HTML中,某些字符是预留的,用来编写HTML代码的。所以这时程序员就不能直接使用他们。

比如:< 和 >。<>是HTML最常用的两个字符,程序员想要使用他们本身,必须用HTML实体。

更多HTML实体,请参考:https://www.w3school.com.cn/html/html_entities.asp

Python处理实体

那么Python中如何处理HTML实体呢?

我这里是Python3.7

html库,该库自带。

值得一说的是,Python2中反转义库是:HTMLParser

转义

import html    print(html.escape('username=wudao&password=123'))    # username=wudao&amp;password=123

反转义

import html    print(html.unescape('username=wudao&amp;password=123'))  # username=wudao&password=123