Skip to content

agent-browser

浏览器自动化代表 — 让 Agent 从"回答问题"升级为"操作网页"

Core Concept

Agent 可基于网页快照识别元素,执行打开页面、点击、输入、提交、截图、抽取内容等动作。是自动化、测试、表单填写、网页数据抽取等场景的基础组件。

Core Features

  • 元素识别:基于网页快照识别可交互元素
  • 自动化操作:打开页面、点击、输入、提交
  • 数据抽取:从网页中提取结构化数据
  • 截图能力:页面可视化记录

Use Cases

  • 运营团队每天需登录多个后台查看订单、广告、库存或线索数据
  • 自动进入页面、填写筛选条件并提取结果

Resources

Released under the MIT License.