摘要:你是否想过,AI 不应该只在对话框里陪你聊天,而应该帮你去买票、填表、修 Bug?昨天 GitHub 上最火的两个 Agent 项目——Browser-Use(让 AI 控制浏览器)和Cline(让 AI 控制 VS Code),正在把“全自动工作流”变成现实。本文手把手教你配置这两个神器,解放双手。
💡 前言:从 Chatbot 到 Agent
2025 年我们还在惊叹 AI 能写诗,2026 年我们开始惊叹 AI 能干活。Agent(智能体)的核心区别在于:Chatbot 只能输出文本,而 Agent 可以执行工具。昨天大火的这两个项目,分别接管了你的浏览器和编辑器。
1. 🌐 Browser-Use:给 AI 一双看网页的眼睛
项目地址:https://github.com/browser-use/browser-use
这是一个什么神仙项目?
它是一个 Python 库,能让 AI(如 DeepSeek, GPT-4o, Claude)直接连接到一个无头浏览器(Headless Browser)。
它可以做什么?
自动订票:“帮我监控本周五去上海的高铁票,有票直接锁单。”
竞品分析:“把 Amazon 上这个类目下排名前 10 的商品价格、评论数爬下来,存到 Excel 里。”