兴趣类-python边学边练(1)
- 2020 年 3 月 5 日
- 筆記
最近在学习的过程中出现了懒惰情况,仔细总结发现看教程视频太枯燥,在没有其他编程语言基础的情况下很难懂,虽然python简单,但是那也是对那些c java php熟悉的人来讲,所以不要再说python简单了,就像我说设计简单一样,因为我做这个工作的。
在网上找到了一个爬去数据的代码 回来仔细研究 贴下来给大家看看
1 每天抓取51job 智联的500强相关职位并发送到邮箱和微信
2 建立一个股票数据爬取模型
预计在6月份之前搞定
先学习爬取网站数据
# 导入requests
import requests
# 发出http请求define re
re = requests.get("https://www.baidu.com/")
# 查看响应状态
print(re.status_code)
# 查看url
print(re.url)
# 查看响应内容
print(re.text)
# 查看编码
print(re.encoding)
# 二进制响应内容
print(re.content)
# json响应内容
print(re.json)
小知识点:明天学习会用到的 xpath
如何安装:pip install lxml
XPath的简单调用方法:
from lxml import etree
selector=etree.HTML(源码) #将源码转化为能被XPath匹配的格式
selector.xpath(表达式) #返回为一列表