概念定义 · v1.0

AgentOS

为「人 + AI Agent 长期共存」设计的运行环境

2026 / 06 基于 30+ 来源调研 5 个标杆案例拆解 多轮概念辨析
AgentOS 是一个为「人 + 多个 AI Agent 长期共存与协作」而设计的运行环境,它统一管理 Agent 的状态、资源、工具、记忆和人机协调机制,使多个 Agent 能在同一个工作上下文中持续地、并发地完成任务。
第 I 章

核心定义

AgentOS 是一个为「人 + 多个 AI Agent 长期共存与协作」而设计的运行环境,它统一管理 Agent 的状态、资源、工具、记忆和人机协调机制,使多个 Agent 能在同一个工作上下文中持续地、并发地完成任务。

每个关键词都有承重,不可替换:

运行环境
不是工具、不是框架、不是助手;是基底。
多个 Agent
不是单 agent。单 agent 是 Agent App。
长期共存
不是一次性会话。时间维度上是常驻。
同一上下文
不是相互隔离的 N 个对话。状态是共享的。
持续并发
不是 request-response。多 Agent 并行长时运行。
协调机制
这是 OS 区别于工具集的关键。
第 II 章

本质:主体的容器

传统应用是「功能的容器」,AgentOS 是「主体的容器」。

传统应用容纳的是函数、按钮、表单——它们没有意志。AgentOS 容纳的是 Agent——它们能自主行动、有记忆、会冲突、会协作。

这种结构和传统操作系统是同构的。操作系统在计算机历史上一直对应同一件事:管理多个相互独立的主体共存。AgentOS 是这个抽象的延续——只是被管理的对象从"进程"升级成了"具有自主性的 Agent"。

传统 OSAgentOS
进程(Process)Agent
调度器(Scheduler)Orchestrator
内存(Memory)Context Window
文件系统(File System)Memory / Skill Library
系统调用(Syscall)Tool / MCP Call
权限(Permission)Permission Mode
ShellChat / Canvas 界面
多用户(Multi-user)多 Agent(Multi-agent)
第 III 章

与传统应用的本质差异

维度传统应用AgentOS
主体性 单主体:人是唯一行动者 多主体:人 + N 个 Agent 都是 actor
控制流 User-driven(用户驱动) Agent-driven + Human-in-loop
时间性 Request-response(即时响应) Long-running(跨小时/天/项目)
确定性 相同输入 → 相同输出 概率性推理,需要可观测与补偿

任何一条不成立,都不构成 AgentOS——可能是更好的 App、更聪明的助手、更智能的 IDE,但范式上还是传统应用

最重要的一条是「主体性」。环境里一旦有 ≥2 个 actor,协调问题就出现了——这就是 OS 要解决的事。
第 IV 章

必要条件(5 条)

1. 多 Agent 编排(Orchestration)

能同时运行 ≥2 个对等 Agent,并管理它们的并发(worktree、隔离 context)、通信(消息、共享 state)、调度(依赖、优先级)。

判别点 · 不是"main agent 临时召唤 subagent",而是"多个对等 Agent 可以并行长期运行"。

2. 长期记忆与状态持久化(Memory)

跨 session、跨重启、跨设备的"自我":项目级记忆(约定、约束、历史)、Agent 级身份(人格、风格、偏好)、任务级状态(plan、进度、决策日志)。

判别点 · 关掉重开,Agent 是否记得之前的项目上下文?

3. 资源治理(Resource Governance)

对 Agent 消耗的资源可见、可控、可调度:Context window、Token / cost、Cache hit rate、模型路由。

判别点 · 用户能看到资源消耗并主动调度吗?

4. 可扩展的工具/技能系统(Capability Layer)

Agent 的能力是可注册、可隔离、可复用的:工具协议(MCP 或等价物)、Skill / Prompt 库(个人沉淀)、权限粒度(每个工具的访问范围)。

判别点 · 用户能自己加新能力而不重新打包应用吗?

5. 人机协作协议(Human-in-Loop Protocol)

Agent 自主行动时,人是协作者而不是旁观者:Permission 分级、Approval gate、Interruption、可观测性。

判别点 · Agent 跑飞了你能不能截停、回滚、纠正?

第 V 章

形态光谱(8 档)

01
传统应用
Office 2010、原 VSCode
无 AI · 单主体 · 即时响应 · User-driven
02
AI 增强应用
Office 365 + Copilot、Photoshop AI
AI 是 feature · 单主体 + AI 局部工具
03
AI 原生应用
Cursor、Perplexity、Granola
没 AI 这产品就不存在 · 但仍是 user-driven · 单 agent
04
AI 助手
ChatGPT、Claude.ai、豆包
对话式 · 单 agent · 浅记忆 · 1 人 + 1 AI
05
垂直 Agent
Devin、Lovable、Bolt、v0、Manus
第一次"Agent 自己跑" · 长时 · 单 agent · 聚焦特定任务
06
Agent IDE
Cursor Composer、Claude Code、Codex、Cline
多工具 · 单 session · 1 main + N subagent · 聚焦代码
07
Agent Workbench
Vibe Kanban、constellagent、Spec Kit · 也包括你的项目
多 agent 编排 · GUI 化 · wrapper 现有 agent · 从代码扩展到工作场景
08
AgentOS
Proma、xue/AgentOS
5 项必要条件齐备 · 1 人 + N Agent 长期共存 · 全长时 · 主体协商

关键分水岭

第 VI 章

参考架构(6 层)

User Space · 用户态
L5
Application Agents
用户面对的角色 Agent(CEO、Coder、Reviewer…)
L4
Skill / Tool RegistryMCP
能力市场:可装、可卸、可复用
L3
Memory & Context
状态层:短期 / 长期 / 项目 / 人格
Kernel Space · 内核态
L2
Orchestration
调度:并发、通信、worktree
L1
Agent Runtime
Agent loop、token、采样、流式
L0
Permission & Sandbox
权限、隔离、可观测性

关键判断

只做 Layer 4-5(skill 库 / 应用层 Agent)= Agent 应用集市。
做了 Layer 0-3(权限、内核、调度、状态)= AgentOS。

很多自称 "AgentOS" 的产品其实只做了 Layer 4-5,是个 Agent 应用集市,严格说不是 OS。

第 VII 章

边界(5 条排除性定义)

vs Agent App

Agent App 是单 Agent 解决单领域任务(ChatGPT、Devin、Lovable、v0、Claude.ai)。

检验 · 能否让多个不同角色的 Agent 在同一个项目上协作?不能 → App

vs Agent 框架

Agent 框架是开发库(LangChain、AutoGen、CrewAI、Claude Agent SDK)。

检验 · 是给开发者 import 写代码,还是给最终用户直接打开用?前者是框架,AgentOS 用它当 kernel。

vs 传统 OS + AI

传统 OS + AI 是 Windows + Copilot、macOS + Apple Intelligence、腾讯 Marvis 这类。

检验 · AI 是 OS 的"附加功能"还是"基本单位"?前者是 OS-augmenting Agent App,后者才是 AgentOS。

vs 工作流自动化平台

工作流平台是 n8n、Zapier、Dify。

检验 · 是预定义 DAG 为主,还是 Agent 自主决策为主?前者是 workflow,AgentOS 让 Agent 决定 workflow。

vs AI IDE / Coding Agent

AI IDE 是 Cursor、Claude Code(聚焦代码场景)。

检验 · 脱离代码场景还成立吗?AI IDE 脱离代码就不工作,AgentOS 可以承载非代码任务。

第 VIII 章

判别框架

5 / 5AgentOS
3 – 4 / 5AgentOS 雏形 / 半成品(光谱档 6-7)
1 – 2 / 5Agent App(光谱档 3-5)
0 / 5传统应用(光谱档 1-2)
第 IX 章

关键设计概念

9.1 人在回路(Human-in-the-Loop)

人在回路 ≠ 人不在。它的真实含义是:

Agent 持续运行的循环中,人在关键节点保留「边际权力」。

回路至少有 4 种类型,对应不同的设计考量:

回路触发时机设计核心
Approval Loop
批准
Agent 准备做高风险动作前 风险分级 + 默认行为
Correction Loop
纠偏
Agent 跑偏 / 误解 / 卡住 可观测性 + 可中断
Teaching Loop
教学
任务结束后的反馈 反馈持久化 → memory / skill
Handoff Loop
接管
Agent 能力边界外 优雅交接 + 状态保留

核心设计变量是回路的频率粒度。高频细粒度 → 安全但烦(approval theatre);低频粗粒度 → 高效但险。理想态:按风险动态自适应。

这就是为什么 5 级权限模式(Plan / Auto / Default / Accept Edits / Bypass)是 AgentOS 的"宪法层"设计——不是 feature,是主体性的边界协商机制

9.2 主体性的边界协商

人在回路是宪法,权限模式是议会,approval gate 是法律。

9.3 资源治理:AgentOS 区别于 Agent 应用的关键

传统应用的资源是隐式的(CPU、RAM 由 OS 管,用户不感知)。AgentOS 的资源必须是显式的——context、token、cost 都需要用户感知和参与决策。

这是 Claude Code 等单厂商工具结构性做不到的——它们的商业模式反向(鼓励消耗,不鼓励优化)。这一条结构性空白,永远留给 wrapper 层。

第 X 章

命名的诚实辨析

"AgentOS" 这个词的合适性,取决于用途:

用途是否合适
行业讨论 / 趋势命名✓ 合适:简洁、传神
心智模型 / 概念框架✓ 合适:用 OS 结构思考多 Agent 协调非常有用
早期 indie 项目的产品名✓ 可用:叙事杠杆 > 承诺风险
成熟 / 商业 / 严肃产品的定位词⚠ 慎用:承诺过重,限制空间

关键区分:「框架」vs「身份」

框架

用来理解和分析
AgentOS 概念可以作为认识工具,用于设计、判断、对比。

身份

用来自我定位
Workbench / Workstation / Studio 这类词更克制、更准确。

用 AgentOS 框架来理解 / 设计你的产品,但不必把产品命名为 AgentOS。

类比:软件工程师用 OS 原理思考一个 web app 的并发问题,不会把 web app 改名叫 OS。建筑师用城市规划思考小区设计,不会把小区改名叫城市。

框架是认识工具,身份是承诺工具。两者不必相同。

"Workbench" 作为身份词的优势

维度OSWorkbench
隐喻来源计算机系统木工 / 实验室 / 创作
承诺重量轻而克制
单复数一个就够可以有多个
工程规模感团队 / 公司级个人 / 小团队级
文化根基"OS" 普遍觉得很重IBM / Eclipse / Smalltalk · 30 年好传统
第 XI 章

生态位判断

AgentOS 不是替代传统应用、不是替代 AI IDE、不是替代垂直 Agent——它是一个新的容器范畴,承载"超级个体在 Agent 时代的工作环境"这个细分需求。

玩家类型代表长期定位
原厂内核 Claude Agent SDK、Codex SDK Layer 1(永远是底层)
原厂应用 Claude.ai、ChatGPT + Operator 消费级 AgentOS(标准化)
大厂第三方 Cursor、Replit Agent 横向整合的 Workbench
超级个体自建 Proma、xue/AgentOS 极致个人化 + 多厂商 + 本地

5 个结构性约束:原厂吃不下全部生态位

  1. 商业模式天然反向 · 鼓励 token 消耗 vs 用户要优化
  2. 多厂商需求结构性反向 · Anthropic 不会做"路由到 GPT"的功能
  3. DNA 错配 · model lab 做不好桌面工作台体验
  4. Vibe 反规模化 · 大公司必须做最大公约数,无法做高度个人化
  5. 开源 / 闭源张力 · SDK 越开放,wrapper 层活得越好
底层平台越成功,上层应用空间越大。
Anthropic / OpenAI 越成功,Workbench 类产品的市场越大。
第 XII 章

开放性与演化

这份定义的边界条件

  1. 时间敏感 · 本定义基于 2026 年 6 月的状态。AgentOS 概念在快速演化,6-12 个月可能出现重要修正。
  2. 样本偏向 · 当前案例集中在超级个体自建项目,企业级 AgentOS 形态可能不同。
  3. "AgentOS" 这个词本身可能被取代 · 历史上 "Information Superhighway" → Internet、"Cyberspace" → Web,早期 metaphor 都是过渡命名。
  4. 5 个必要条件是必要不充分 · 可能还有第 6、第 7 条我们还没看清。

尚未解决的问题

AgentOS = 多 Agent × 长期共存 × 资源治理 × 人机协作 × 状态持久化

= 一个让「人 + AI」能像「多人公司」一样长期协作的运行环境。

它是认识 Agent 时代工作环境的有效框架,
但不一定是每个产品需要自我加冕的身份。