为「人 + AI Agent 长期共存」设计的运行环境
先精确,再展开
AgentOS 是一个为「人 + 多个 AI Agent 长期共存与协作」而设计的运行环境,它统一管理 Agent 的状态、资源、工具、记忆和人机协调机制,使多个 Agent 能在同一个工作上下文中持续地、并发地完成任务。
每个关键词都有承重,不可替换:
为什么 OS 这个结构在 Agent 时代会再次出现
传统应用是「功能的容器」,AgentOS 是「主体的容器」。
传统应用容纳的是函数、按钮、表单——它们没有意志。AgentOS 容纳的是 Agent——它们能自主行动、有记忆、会冲突、会协作。
这种结构和传统操作系统是同构的。操作系统在计算机历史上一直对应同一件事:管理多个相互独立的主体共存。AgentOS 是这个抽象的延续——只是被管理的对象从"进程"升级成了"具有自主性的 Agent"。
| 传统 OS | AgentOS |
|---|---|
| 进程(Process) | Agent |
| 调度器(Scheduler) | Orchestrator |
| 内存(Memory) | Context Window |
| 文件系统(File System) | Memory / Skill Library |
| 系统调用(Syscall) | Tool / MCP Call |
| 权限(Permission) | Permission Mode |
| Shell | Chat / Canvas 界面 |
| 多用户(Multi-user) | 多 Agent(Multi-agent) |
不是功能差异,是范式差异
| 维度 | 传统应用 | AgentOS |
|---|---|---|
| 主体性 | 单主体:人是唯一行动者 | 多主体:人 + N 个 Agent 都是 actor |
| 控制流 | User-driven(用户驱动) | Agent-driven + Human-in-loop |
| 时间性 | Request-response(即时响应) | Long-running(跨小时/天/项目) |
| 确定性 | 相同输入 → 相同输出 | 概率性推理,需要可观测与补偿 |
任何一条不成立,都不构成 AgentOS——可能是更好的 App、更聪明的助手、更智能的 IDE,但范式上还是传统应用。
最重要的一条是「主体性」。环境里一旦有 ≥2 个 actor,协调问题就出现了——这就是 OS 要解决的事。
缺一不可,缺一即退化为 Agent App
能同时运行 ≥2 个对等 Agent,并管理它们的并发(worktree、隔离 context)、通信(消息、共享 state)、调度(依赖、优先级)。
判别点 · 不是"main agent 临时召唤 subagent",而是"多个对等 Agent 可以并行长期运行"。
跨 session、跨重启、跨设备的"自我":项目级记忆(约定、约束、历史)、Agent 级身份(人格、风格、偏好)、任务级状态(plan、进度、决策日志)。
判别点 · 关掉重开,Agent 是否记得之前的项目上下文?
对 Agent 消耗的资源可见、可控、可调度:Context window、Token / cost、Cache hit rate、模型路由。
判别点 · 用户能看到资源消耗并主动调度吗?
Agent 的能力是可注册、可隔离、可复用的:工具协议(MCP 或等价物)、Skill / Prompt 库(个人沉淀)、权限粒度(每个工具的访问范围)。
判别点 · 用户能自己加新能力而不重新打包应用吗?
Agent 自主行动时,人是协作者而不是旁观者:Permission 分级、Approval gate、Interruption、可观测性。
判别点 · Agent 跑飞了你能不能截停、回滚、纠正?
AgentOS 是 AI 产品光谱的最右端,实际产品连续分布
从内核到用户态,从基础设施到应用
只做 Layer 4-5(skill 库 / 应用层 Agent)= Agent 应用集市。
做了 Layer 0-3(权限、内核、调度、状态)= AgentOS。
很多自称 "AgentOS" 的产品其实只做了 Layer 4-5,是个 Agent 应用集市,严格说不是 OS。
定义清楚"什么不是",才能让"什么是"有意义
Agent App 是单 Agent 解决单领域任务(ChatGPT、Devin、Lovable、v0、Claude.ai)。
检验 · 能否让多个不同角色的 Agent 在同一个项目上协作?不能 → App
Agent 框架是开发库(LangChain、AutoGen、CrewAI、Claude Agent SDK)。
检验 · 是给开发者 import 写代码,还是给最终用户直接打开用?前者是框架,AgentOS 用它当 kernel。
传统 OS + AI 是 Windows + Copilot、macOS + Apple Intelligence、腾讯 Marvis 这类。
检验 · AI 是 OS 的"附加功能"还是"基本单位"?前者是 OS-augmenting Agent App,后者才是 AgentOS。
工作流平台是 n8n、Zapier、Dify。
检验 · 是预定义 DAG 为主,还是 Agent 自主决策为主?前者是 workflow,AgentOS 让 Agent 决定 workflow。
AI IDE 是 Cursor、Claude Code(聚焦代码场景)。
检验 · 脱离代码场景还成立吗?AI IDE 脱离代码就不工作,AgentOS 可以承载非代码任务。
10 秒判断一个产品的范畴
三个最容易被误解的设计变量
人在回路 ≠ 人不在。它的真实含义是:
Agent 持续运行的循环中,人在关键节点保留「边际权力」。
回路至少有 4 种类型,对应不同的设计考量:
| 回路 | 触发时机 | 设计核心 |
|---|---|---|
| Approval Loop 批准 |
Agent 准备做高风险动作前 | 风险分级 + 默认行为 |
| Correction Loop 纠偏 |
Agent 跑偏 / 误解 / 卡住 | 可观测性 + 可中断 |
| Teaching Loop 教学 |
任务结束后的反馈 | 反馈持久化 → memory / skill |
| Handoff Loop 接管 |
Agent 能力边界外 | 优雅交接 + 状态保留 |
核心设计变量是回路的频率和粒度。高频细粒度 → 安全但烦(approval theatre);低频粗粒度 → 高效但险。理想态:按风险动态自适应。
这就是为什么 5 级权限模式(Plan / Auto / Default / Accept Edits / Bypass)是 AgentOS 的"宪法层"设计——不是 feature,是主体性的边界协商机制。
人在回路是宪法,权限模式是议会,approval gate 是法律。
传统应用的资源是隐式的(CPU、RAM 由 OS 管,用户不感知)。AgentOS 的资源必须是显式的——context、token、cost 都需要用户感知和参与决策。
这是 Claude Code 等单厂商工具结构性做不到的——它们的商业模式反向(鼓励消耗,不鼓励优化)。这一条结构性空白,永远留给 wrapper 层。
"OS" 这个词是 metaphor,不是技术定义
"AgentOS" 这个词的合适性,取决于用途:
| 用途 | 是否合适 |
|---|---|
| 行业讨论 / 趋势命名 | ✓ 合适:简洁、传神 |
| 心智模型 / 概念框架 | ✓ 合适:用 OS 结构思考多 Agent 协调非常有用 |
| 早期 indie 项目的产品名 | ✓ 可用:叙事杠杆 > 承诺风险 |
| 成熟 / 商业 / 严肃产品的定位词 | ⚠ 慎用:承诺过重,限制空间 |
用来理解和分析
AgentOS 概念可以作为认识工具,用于设计、判断、对比。
用来自我定位
Workbench / Workstation / Studio 这类词更克制、更准确。
用 AgentOS 框架来理解 / 设计你的产品,但不必把产品命名为 AgentOS。
类比:软件工程师用 OS 原理思考一个 web app 的并发问题,不会把 web app 改名叫 OS。建筑师用城市规划思考小区设计,不会把小区改名叫城市。
框架是认识工具,身份是承诺工具。两者不必相同。
| 维度 | OS | Workbench |
|---|---|---|
| 隐喻来源 | 计算机系统 | 木工 / 实验室 / 创作 |
| 承诺重量 | 重 | 轻而克制 |
| 单复数 | 一个就够 | 可以有多个 |
| 工程规模感 | 团队 / 公司级 | 个人 / 小团队级 |
| 文化根基 | "OS" 普遍觉得很重 | IBM / Eclipse / Smalltalk · 30 年好传统 |
为什么原厂吃不下 AgentOS 全部生态位
AgentOS 不是替代传统应用、不是替代 AI IDE、不是替代垂直 Agent——它是一个新的容器范畴,承载"超级个体在 Agent 时代的工作环境"这个细分需求。
| 玩家类型 | 代表 | 长期定位 |
|---|---|---|
| 原厂内核 | Claude Agent SDK、Codex SDK | Layer 1(永远是底层) |
| 原厂应用 | Claude.ai、ChatGPT + Operator | 消费级 AgentOS(标准化) |
| 大厂第三方 | Cursor、Replit Agent | 横向整合的 Workbench |
| 超级个体自建 | Proma、xue/AgentOS | 极致个人化 + 多厂商 + 本地 |
底层平台越成功,上层应用空间越大。
Anthropic / OpenAI 越成功,Workbench 类产品的市场越大。
这份定义有时效,也有边界
AgentOS = 多 Agent × 长期共存 × 资源治理 × 人机协作 × 状态持久化
= 一个让「人 + AI」能像「多人公司」一样长期协作的运行环境。
它是认识 Agent 时代工作环境的有效框架,
但不一定是每个产品需要自我加冕的身份。