Python 常用包整理
- 2020 年 1 月 6 日
- 筆記
2.通過zlib實現壓縮與解壓字元串的方法。
3.Base64編碼和解碼。
4.hashlib是涉及安全散列和消息摘要,提供多個不同的加密演算法借口,如SHA1、SHA224、SHA256、SHA384、SHA512、MD5等。
5.cookielib庫主要功能是提供可存儲cookie的對象。使用此模組捕獲cookie並在後續連接請求時重新發送,還可以用來處理包含cookie數據的文件。
6.HTMLParser是Python自帶的模組,使用簡單,能夠很容易的實現HTML文件的分析。
7.python queue模組有三種隊列: 1、python queue模組的FIFO隊列先進先出。 2、LIFO類似於堆。即先進後出。 3、還有一種是優先順序隊列級別越低越先出來。 針對這三種隊列分別有三個構造函數: 1、class Queue.Queue(maxsize) FIFO 2、class Queue.LifoQueue(maxsize) LIFO 3、class Queue.PriorityQueue(maxsize) 優先順序隊列
8.Beautiful Soup
eautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,通過解析文檔為用戶提供需要抓取的數據,因為簡單,所以不需要多少程式碼就可以寫出一個完整的應用程式。
Beautiful Soup自動將輸入文檔轉換為Unicode編碼,輸出文檔轉換為utf-8編碼。你不需要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然後,你僅僅需要說明一下原始編碼方式就可以了。
Beautiful Soup已成為和lxml、html6lib一樣出色的python解釋器,為用戶靈活地提供不同的解析策略或強勁的速度。
9.python的logging模組將日誌列印到了標準輸出中,且只顯示了大於等於WARNING級別的日誌, 這說明默認的日誌級別設置為WARNING(日誌級別等級CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET), 默認的日誌格式為: 日誌級別:Logger名稱:用戶輸出消息。