selenium学习之基本操作(一)
- 2020 年 10 月 6 日
- 筆記
- Python, selenium, selenium学习笔记, 爬虫
通过selenium的使用可以驱动浏览器来模拟加载网页,简单定位元素和获取对应的数据:
# find_elements_by_id #(根据id属性值获取元素列表)
# find_elements_by_class_name #(根据类名获取元素列表)
# find_elements_by_tag_name #(根据标签名获取元素列表)
# find_elements_by_xpath #(返回一个包含元素的列表)
# find_element_by_link_text #(根据标签的文本获取元素列表,精确定位)
# find_elements_by_partial_link_text #(根据标签包含的文本获取元素列表,模糊定位)
1 from selenium import webdriver
2
3 if __name__ == "__main__":
4 # 1.创建有界面的浏览器对象
5 driver= webdriver.Chrome()
6 driver.maximize_window() # 最大化窗口
7 driver.refresh() # 刷新页面
8
9 # 2.请求页面
10 driver.get("//www.baidu.com/")
11
12 # 3.页面的基本操作(点击、输入)
13 driver.find_element_by_id("kw").send_keys("动物") # 实现输入操作
14 driver.find_element_by_id("su").click() # 实现点击操作
15 driver.save_screenshot("baidu.png") # 获取页面截图
16 print(driver.page_source) # 获取渲染之后的数据(即请求网页后的Elements代码)
17 print(driver.get_cookies()) # 获取请求页面后的cookie值
18 print(driver.current_url) # 获取当前页面的URL
19 driver.close() # 关闭页面
20 driver.quit() # 关闭浏览器