白乐天

道阻且长,行则将至。

selenium

Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作。

安装ChromeDriver

Selenium的使用需要配合Chrome浏览器,需要额外安装ChromeDriver 和 Chrome 浏览器。
安装好Chrome 浏览器并可以正常运行之后,点击 Chrome 的菜单,帮助 -> 关于 Chrome,查看 Chrome 的版本号,然后到ChromeDriver 的官方网站https://sites.google.com/chromium.org/driver/downloads下载对应的ChromeDriver 版本。

环境变量配置

Windows建议直接将 chromedriver.exe 文件拖到 Python 的 Scripts 目录下。
也可以单独将其所在路径配置到环境变量。
配置完成之后,就可以在命令行下直接执行 chromedriver 命令了。

1
chromedriver

安装Selenium

使用pip直接安装

1
pip install selenium

可以运行一个脚本测试
弹出一个 Chrome 浏览器并加载了百度页面,10 秒之后就关闭。

1
2
3
4
5
6
7
from selenium import webdriver
from time import sleep

browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
sleep(10)
browser.close()

常用浏览器操作

打开页面

1
driver.get("https://xxx.com")

获取URL

1
url = driver.current_url

获取标题

1
title = driver.title

页面元素定位

使用By类型(需要导入By)

1
from selenium.webdriver.common.by import By

通过ID定位

1
element = driver.find_element(By.ID, "xxx")

通过