【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等
AI Manus 是一个通用的 AI Agent 系统,可以完全私有部署,支持在沙盒环境中运行各种工具和操作。
AI Manus 项目目标是希望成为可完全私有部署的企业级 Manus 应用。垂类 Manus 的应用有多种重复性的工程化工作,这个项目希望把这部分统一,让大家可以像搭积木一下建立起一个垂类 Manus 应用。
AI Manus 中每个服务与工具都包含一个 Built-in 版本,可以做到完全私有部署。后续可以通过 A2A 与 MCP 协议,把 Built-in 的 Agent 与 Tools 都置换掉。底层基建也可以通过提供多样的提供商配置或者简单的开发适配置换掉。AI Manus 从架构设计上便支持分布式多实例部署,方便横向扩展,达到企业级的部署要求。
文章目录
- 【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等
- 核心功能
- ⚙️ 系统架构
- 整体设计
- 🚀 快速上手
- 环境准备
- Docker 安装
- Windows & Mac 系统
- Linux 系统
- 部署
- MCP 配置
- 简介
- 演示
- 配置说明
- MCP 配置文件
- 配置文件结构
- 当前配置示例
- Docker Compose 配置
- 更多资源
- 📋 配置说明
- 配置项
- 模型提供商配置
- 模型配置
- MongoDB 配置
- Redis 配置
- 沙箱配置
- 搜索引擎配置
- Google 搜索配置
- 认证配置
- 密码认证配置
- 本地认证配置
- JWT 配置
- 邮箱配置
- MCP 配置
- 日志配置
核心功能
部署:最小只需要一个 LLM 服务即可完成部署,不需要依赖其它外部服务。
工具:支持 Terminal、Browser、File、Web Search、消息工具,并支持实查看和接管。
沙盒:每个 Task 会分配单独的一个沙盒,沙盒在本地 Dock 环境里面运行。
任务会话:通过 Mongo/Redis 对会话历史进行管理,支持后台任务。
对话:支持停止与打断,支持文件上传与下载。
多语言:支持中文与英文。
认证:用户登录与认证。
⚙️ 系统架构
整体设计
当用户发起对话时:
- Web 向 Server 发送创建 Agent 请求,Server 通过
/var/run/docker.sock创建出 Sandbox,并返回会话 ID。 - Sandbox 是一个 Ubuntu Docker 环境,里面会启动 chrome 浏览器及 File/Shell 等工具的 API 服务。
- Web 往会话 ID 中发送用户消息,Server 收到用户消息后,将消息发送给 PlanAct Agent 处理。
- PlanAct Agent 处理过程中会调用相关工具完成任务。 <