主题
浏览器工具
概述
浏览器工具(Agent Browser)是 OpenClaw 内置的核心工具之一,让 Agent 能够自动化操作浏览器——访问网页、提取信息、填写表单、点击按钮,实现与 Web 应用的交互。
核心能力
| 能力 | 说明 |
|---|---|
| 网页访问 | 访问 URL 并提取页面内容 |
| 截图捕获 | 对当前页面截图,用于视觉分析 |
| 表单填写 | 定位输入框、输入文字、选择下拉选项 |
| 点击操作 | 点击按钮、链接、菜单项 |
| 页面滑动 | 滚动页面、拖拽元素 |
| JavaScript 执行 | 在页面上下文中运行 JS 代码 |
| 数据抓取 | 从网页提取结构化数据 |
Docker 镜像变体
OpenClaw 提供两个支持浏览器的 Docker 镜像:
| 镜像 | 说明 |
|---|---|
openclaw/sandbox | 包含沙箱隔离环境 |
openclaw/sandbox-browser | 包含沙箱 + 完整浏览器(Chromium) |
AutoClaw 内置浏览器
如果你使用 AutoClaw(智谱一键安装版),浏览器操作能力已经内置(集成 AutoGLM Browser-Use),无需额外配置。
使用场景
信息提取
text
帮我打开这个网页,提取所有产品名称和价格,整理成表格表单自动化
text
帮我登录 XX 网站,填写报名表,姓名填张三,手机号填 138xxxx竞品调研
text
打开这 5 个竞品网站,截图并分析它们的定价策略移动端文件处理
通过 Telegram/飞书发送图片或文件给 OpenClaw,它会自动处理:
| 文件类型 | 自动处理方式 |
|---|---|
| 图片 | OCR 识别文字 |
| CSV / Excel | 数据统计和可视化 |
| 提取文本并总结 | |
| 代码文件 | 代码审查和优化建议 |
安全注意事项
- 浏览器操作需要 Tools Profile 设置为
full - 不要让 Agent 在不受信任的网站上输入敏感信息
- 生产环境建议使用 sandbox-browser 镜像实现隔离