興趣類-python邊學邊練(1)
- 2020 年 3 月 5 日
- 筆記
最近在學習的過程中出現了懶惰情況,仔細總結髮現看教程視頻太枯燥,在沒有其他編程語言基礎的情況下很難懂,雖然python簡單,但是那也是對那些c java php熟悉的人來講,所以不要再說python簡單了,就像我說設計簡單一樣,因為我做這個工作的。
在網上找到了一個爬去數據的代碼 回來仔細研究 貼下來給大家看看
1 每天抓取51job 智聯的500強相關職位並發送到郵箱和微信
2 建立一個股票數據爬取模型
預計在6月份之前搞定
先學習爬取網站數據
# 導入requests
import requests
# 發出http請求define re
re = requests.get("https://www.baidu.com/")
# 查看響應狀態
print(re.status_code)
# 查看url
print(re.url)
# 查看響應內容
print(re.text)
# 查看編碼
print(re.encoding)
# 二進制響應內容
print(re.content)
# json響應內容
print(re.json)
小知識點:明天學習會用到的 xpath
如何安裝:pip install lxml
XPath的簡單調用方法:
from lxml import etree
selector=etree.HTML(源碼) #將源碼轉化為能被XPath匹配的格式
selector.xpath(表達式) #返回為一列表