DrissionPage 自动化工具使用详解<\/h1>

概述<\/h2>
DrissionPage 是一个基于 Python 的网页自动化工具，它结合了浏览器自动化的便利性和 requests 的高效率。相比 Selenium、Playwright 和 Pyppeteer，DrissionPage 具有以下独特优势：<\/p>
无 webdriver 特征<\/li>
无需为不同浏览器版本下载不同驱动<\/li>
运行速度更快<\/li>
支持跨 iframe 查找元素<\/li>
可同时操作浏览器中的多个标签页<\/li>
可直接读取浏览器缓存保存图片<\/li>
支持全网页截图（包括视口外部分）<\/li>
可处理非 open 状态的 shadow-root<\/li> <\/ul>
安装与升级<\/h2>
# 安装<\/span>
<\/span><\/span>pip install DrissionPage
<\/span><\/span>
<\/span><\/span># 升级到最新稳定版<\/span>
<\/span><\/span>pip install DrissionPage --upgrade
<\/span><\/span>
<\/span><\/span># 指定版本升级<\/span>
<\/span><\/span>pip install DrissionPage==<\/span>4.0.0b17
<\/span><\/span><\/code><\/pre>基本使用<\/h2>
初始化浏览器<\/h3>
from<\/span> DrissionPage import<\/span> ChromiumPage, ChromiumOptions
<\/span><\/span>
<\/span><\/span># 配置浏览器选项<\/span>
<\/span><\/span>co =<\/span> ChromiumOptions().<\/span>set_paths(
<\/span><\/span>    browser_path=<\/span>r<\/span>"C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe"<\/span>
<\/span><\/span>)
<\/span><\/span>
<\/span><\/span># 可选配置<\/span>
<\/span><\/span>co.<\/span>headless(True<\/span>)  # 设置无头模式<\/span>
<\/span><\/span>co.<\/span>incognito(True<\/span>)  # 设置无痕模式<\/span>
<\/span><\/span>co.<\/span>set_argument('--guest'<\/span>)  # 设置访客模式<\/span>
<\/span><\/span>co.<\/span>set_user_agent()  # 设置请求头user-agent<\/span>
<\/span><\/span>co.<\/span>set_local_port(7890<\/span>)  # 设置指定端口号<\/span>
<\/span><\/span>co.<\/span>set_proxy('http:\/\/localhost:1080'<\/span>)  # 设置代理<\/span>
<\/span><\/span>
<\/span><\/span># 创建页面对象<\/span>
<\/span><\/span>page =<\/span> ChromiumPage(co)
<\/span><\/span><\/code><\/pre>获取浏览器路径的方法<\/h3>

打开浏览器，在地址栏输入：

Chrome: chrome:\/\/version<\/code><\/li>
Edge: edge:\/\/version<\/code><\/li>
<\/ul>
<\/li>
查找"可执行文件路径"或类似字段<\/li>
<\/ol>
访问网页<\/h3>
page.<\/span>get('https:\/\/gitee.com\/login'<\/span>, retry=<\/span>3<\/span>, timeout=<\/span>15<\/span>, interval=<\/span>2<\/span>)
<\/span><\/span><\/code><\/pre>参数说明：<\/p>

retry<\/code>: 重试次数<\/li>
timeout<\/code>: 超时时间（秒）<\/li>
interval<\/code>: 重试间隔时间（秒）<\/li>
<\/ul>
元素定位与操作<\/h2>
元素定位方法<\/h3>
# 通过CSS选择器<\/span>
<\/span><\/span>ele =<\/span> page.<\/span>ele('#user_login'<\/span>)
<\/span><\/span>
<\/span><\/span># 通过XPath<\/span>
<\/span><\/span>page.<\/span>ele('xpath:\/\/input[@id="bindMobileFree"]'<\/span>).<\/span>input("123456789"<\/span>)
<\/span><\/span>
<\/span><\/span># 通过文本内容<\/span>
<\/span><\/span>page.<\/span>ele('text:命令学'<\/span>)
<\/span><\/span>
<\/span><\/span># 通过属性<\/span>
<\/span><\/span>page.<\/span>ele('@value=登录'<\/span>)
<\/span><\/span>
<\/span><\/span># 链式查找<\/span>
<\/span><\/span>text =<\/span> page('@id:footer-left'<\/span>)('css:>div'<\/span>)('text:命令学'<\/span>).<\/span>text
<\/span><\/span><\/code><\/pre>元素操作<\/h3>
# 输入文本<\/span>
<\/span><\/span>ele.<\/span>input('您的账号'<\/span>)
<\/span><\/span>
<\/span><\/span># 点击元素<\/span>
<\/span><\/span>page.<\/span>ele('@value=登录'<\/span>).<\/span>click()
<\/span><\/span>
<\/span><\/span># 获取文本<\/span>
<\/span><\/span>text =<\/span> ele.<\/span>text
<\/span><\/span>
<\/span><\/span># 获取属性<\/span>
<\/span><\/span>href =<\/span> ele.<\/span>attr('href'<\/span>)
<\/span><\/span><\/code><\/pre>等待机制<\/h2>
页面等待方法<\/h3>
page.<\/span>wait.<\/span>load_start()  # 等待页面进入加载状态<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>doc_loaded()  # 等待页面文档加载完成<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>eles_loaded()  # 等待元素被加载到DOM<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>ele_displayed()  # 等待元素显示<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>ele_hidden()  # 等待元素隐藏<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>ele_deleted()  # 等待元素被删除<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>download_begin()  # 等待下载开始<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>new_tab()  # 等待新标签页出现<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>title_change()  # 等待title变化<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>url_change()  # 等待url变化<\/span>
<\/span><\/span>page.<\/span>wait.<\/span>alert_closed()  # 等待弹出框关闭<\/span>
<\/span><\/span>page.<\/span>wait(5<\/span>)  # 等待5秒<\/span>
<\/span><\/span><\/code><\/pre>元素等待方法<\/h3>
ele.<\/span>wait.<\/span>displayed()  # 等待元素显示<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>hidden()  # 等待元素隐藏<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>deleted()  # 等待元素被删除<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>covered()  # 等待元素被覆盖<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>not_covered()  # 等待元素不被覆盖<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>enabled()  # 等待元素可用<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>disabled()  # 等待元素不可用<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>stop_moving()  # 等待元素运动结束<\/span>
<\/span><\/span>ele.<\/span>wait.<\/span>clickable()  # 等待元素可点击<\/span>
<\/span><\/span>ele.<\/span>wait()  # 等待若干秒<\/span>
<\/span><\/span><\/code><\/pre>网络监听<\/h2>
基本用法<\/h3>
page.<\/span>listen.<\/span>start('gitee.com\/explore'<\/span>)  # 开始监听指定URL<\/span>
<\/span><\/span>
<\/span><\/span># 等待并获取一个数据包<\/span>
<\/span><\/span>res =<\/span> page.<\/span>listen.<\/span>wait()
<\/span><\/span>print(res.<\/span>url)
<\/span><\/span>print(res.<\/span>response.<\/span>headers)
<\/span><\/span>print(res.<\/span>response.<\/span>statusText)
<\/span><\/span>print(res.<\/span>response.<\/span>body)
<\/span><\/span><\/code><\/pre>实时获取数据包<\/h3>
page.<\/span>listen.<\/span>start('gitee.com\/explore'<\/span>)
<\/span><\/span>page.<\/span>get('https:\/\/gitee.com\/explore\/all'<\/span>)
<\/span><\/span>
<\/span><\/span>i =<\/span> 0<\/span>
<\/span><\/span>for<\/span> packet in<\/span> page.<\/span>listen.<\/span>steps():
<\/span><\/span>    print(packet.<\/span>url)
<\/span><\/span>    page('@rel=next'<\/span>).<\/span>click()  # 点击下一页<\/span>
<\/span><\/span>    i +=<\/span> 1<\/span>
<\/span><\/span>    if<\/span> i ==<\/span> 5<\/span>:
<\/span><\/span>        break<\/span>
<\/span><\/span><\/code><\/pre>动作链<\/h2>
基本用法<\/h3>
# 使用内置actions属性<\/span>
<\/span><\/span>page.<\/span>actions.<\/span>move_to('#kw'<\/span>).<\/span>click().<\/span>type('DrissionPage'<\/span>)
<\/span><\/span>page.<\/span>actions.<\/span>move_to('#su'<\/span>).<\/span>click()
<\/span><\/span>
<\/span><\/span># 使用独立对象<\/span>
<\/span><\/span>from<\/span> DrissionPage.common import<\/span> Actions
<\/span><\/span>ac =<\/span> Actions(page)
<\/span><\/span>ac.<\/span>move_to('#kw'<\/span>).<\/span>click().<\/span>type('DrissionPage'<\/span>)
<\/span><\/span>ac.<\/span>move_to('#su'<\/span>).<\/span>click()
<\/span><\/span><\/code><\/pre>常用动作方法<\/h3>


鼠标移动：<\/p>
ac.<\/span>move_to(ele)  # 移动到元素<\/span>
<\/span><\/span>ac.<\/span>move(x, y)  # 相对移动<\/span>
<\/span><\/span>ac.<\/span>up(100<\/span>)  # 向上移动100像素<\/span>
<\/span><\/span>ac.<\/span>down(100<\/span>)  # 向下移动<\/span>
<\/span><\/span>ac.<\/span>left(100<\/span>)  # 向左移动<\/span>
<\/span><\/span>ac.<\/span>right(100<\/span>)  # 向右移动<\/span>
<\/span><\/span><\/code><\/pre><\/li>

鼠标点击：<\/p>
ac.<\/span>click()  # 左键单击<\/span>
<\/span><\/span>ac.<\/span>r_click()  # 右键单击<\/span>
<\/span><\/span>ac.<\/span>m_click()  # 中键单击<\/span>
<\/span><\/span>ac.<\/span>db_click()  # 双击<\/span>
<\/span><\/span>ac.<\/span>hold()  # 按住左键<\/span>
<\/span><\/span>ac.<\/span>release()  # 释放左键<\/span>
<\/span><\/span><\/code><\/pre><\/li>

键盘操作：<\/p>
from<\/span> DrissionPage.common import<\/span> Keys
<\/span><\/span>ac.<\/span>key_down(Keys.<\/span>CTRL)  # 按下Ctrl<\/span>
<\/span><\/span>ac.<\/span>type('a'<\/span>)  # 输入a<\/span>
<\/span><\/span>ac.<\/span>key_up(Keys.<\/span>CTRL)  # 释放Ctrl<\/span>
<\/span><\/span># 或简写为<\/span>
<\/span><\/span>ac.<\/span>type(Keys.<\/span>CTRL_A)
<\/span><\/span><\/code><\/pre><\/li>
<\/ul>
拖拽示例<\/h3>
# 向右拖拽300像素<\/span>
<\/span><\/span>ac.<\/span>hold('#div1'<\/span>).<\/span>right(300<\/span>).<\/span>release()
<\/span><\/span>
<\/span><\/span># 拖拽到另一个元素上<\/span>
<\/span><\/span>ac.<\/span>hold('#div1'<\/span>).<\/span>release('#div2'<\/span>)
<\/span><\/span><\/code><\/pre>标签页操作<\/h2>
多标签页管理<\/h3>
# 获取标签页信息<\/span>
<\/span><\/span>print(page.<\/span>tabs_count)  # 标签页数量<\/span>
<\/span><\/span>print(page.<\/span>tab_ids)  # 所有标签页ID<\/span>
<\/span><\/span>
<\/span><\/span># 新建标签页<\/span>
<\/span><\/span>page.<\/span>new_tab()
<\/span><\/span>
<\/span><\/span># 获取标签页对象<\/span>
<\/span><\/span>tab1 =<\/span> page.<\/span>get_tab(1<\/span>)  # 按序号获取<\/span>
<\/span><\/span>tab2 =<\/span> page.<\/span>get_tab(title=<\/span>'百度'<\/span>)  # 按标题获取<\/span>
<\/span><\/span>
<\/span><\/span># 启用多例模式<\/span>
<\/span><\/span>from<\/span> DrissionPage.common import<\/span> Settings
<\/span><\/span>Settings.<\/span>singleton_tab_obj =<\/span> False<\/span>
<\/span><\/span>
<\/span><\/span># 关闭和重连<\/span>
<\/span><\/span>tab1.<\/span>close()
<\/span><\/span>tab1.<\/span>disconnect()
<\/span><\/span>tab1.<\/span>reconnect()
<\/span><\/span>
<\/span><\/span># 关闭多个标签页<\/span>
<\/span><\/span>page.<\/span>close_tabs(ids=<\/span>[tab1.<\/span>id, tab2.<\/span>id])  # 关闭指定标签页<\/span>
<\/span><\/span>page.<\/span>close_tabs(num=<\/span>2<\/span>)  # 关闭前2个标签页<\/span>
<\/span><\/span><\/code><\/pre>截图与录像<\/h2>
截图功能<\/h3>
# 整页截图<\/span>
<\/span><\/span>page.<\/span>get_screenshot(path=<\/span>'tmp'<\/span>, name=<\/span>'pic.jpg'<\/span>, full_page=<\/span>True<\/span>)
<\/span><\/span>
<\/span><\/span># 元素截图<\/span>
<\/span><\/span>img =<\/span> page('tag:img'<\/span>)
<\/span><\/span>img.<\/span>get_screenshot()  # 保存到文件<\/span>
<\/span><\/span>bytes_str =<\/span> img.<\/span>get_screenshot(as_bytes=<\/span>'png'<\/span>)  # 获取二进制数据<\/span>
<\/span><\/span><\/code><\/pre>页面录像<\/h3>
page.<\/span>screencast.<\/span>set_save_path('video'<\/span>)  # 设置保存路径<\/span>
<\/span><\/span>page.<\/span>screencast.<\/span>set_mode.<\/span>video_mode()  # 设置录制模式<\/span>
<\/span><\/span>page.<\/span>screencast.<\/span>start()  # 开始录制<\/span>
<\/span><\/span>page.<\/span>wait(3<\/span>)
<\/span><\/span>page.<\/span>screencast.<\/span>stop()  # 停止录制<\/span>
<\/span><\/span><\/code><\/pre>执行JavaScript<\/h2>
# 设置localStorage<\/span>
<\/span><\/span>page.<\/span>run_js(f<\/span>'localStorage.setItem("__user_token.v3",`<\/span>{<\/span>token}<\/span>`)'<\/span>)
<\/span><\/span>page.<\/span>run_js(f<\/span>'localStorage.setItem("__user_info",`<\/span>{<\/span>token}<\/span>`)'<\/span>)
<\/span><\/span>
<\/span><\/span># 设置cookie<\/span>
<\/span><\/span>cookies_set =<\/span> "document.cookie=`__user_token.v3=<\/span>{token}<\/span>; path=\/;domain=i.shengcaiyoushu.com;`;"<\/span>
<\/span><\/span>page.<\/span>run_js(cookies_set)
<\/span><\/span><\/code><\/pre>反检测机制<\/h2>
DrissionPage 具有内置的反检测特性：<\/p>

无 webdriver 特征<\/li>
无需浏览器驱动<\/li>
默认情况下不会被 bot.sannysoft.com 等检测工具识别<\/li>
无头模式下只需设置 user-agent 即可绕过基本检测<\/li>
<\/ol>
总结<\/h2>
DrissionPage 是一个功能强大、语法简洁的网页自动化工具，具有以下特点：<\/p>

内置强大的自研内核，无需 webdriver<\/li>
提供简洁易用的元素定位语法<\/li>
完善的等待机制，提高脚本稳定性<\/li>
支持网络监听、多标签页操作等高级功能<\/li>
内置反检测机制，可绕过大多数自动化检测<\/li>
支持截图、录像等多媒体操作<\/li>
可执行任意 JavaScript 代码<\/li>
<\/ol>
相比传统自动化工具，DrissionPage 代码更简洁、运行更高效、功能更全面，是目前 Python 网页自动化的优秀解决方案。<\/p>