agent-browser

浏览器自动化代表 — 让 Agent 从"回答问题"升级为"操作网页"

Core Concept

Agent 可基于网页快照识别元素，执行打开页面、点击、输入、提交、截图、抽取内容等动作。是自动化、测试、表单填写、网页数据抽取等场景的基础组件。

Core Features

元素识别：基于网页快照识别可交互元素
自动化操作：打开页面、点击、输入、提交
数据抽取：从网页中提取结构化数据
截图能力：页面可视化记录

Use Cases

运营团队每天需登录多个后台查看订单、广告、库存或线索数据
自动进入页面、填写筛选条件并提取结果

Resources

GitHub