概念定义 · v1.0

AgentOS

为「人 + AI Agent 长期共存」设计的运行环境

2026 / 06 基于 30+ 来源调研 5 个标杆案例拆解多轮概念辨析

AgentOS 是一个为「人 + 多个 AI Agent 长期共存与协作」而设计的运行环境，它统一管理 Agent 的状态、资源、工具、记忆和人机协调机制，使多个 Agent 能在同一个工作上下文中持续地、并发地完成任务。

第 I 章

核心定义

先精确，再展开

AgentOS 是一个为「人 + 多个 AI Agent 长期共存与协作」而设计的运行环境，它统一管理 Agent 的状态、资源、工具、记忆和人机协调机制，使多个 Agent 能在同一个工作上下文中持续地、并发地完成任务。

每个关键词都有承重，不可替换：

运行环境: 不是工具、不是框架、不是助手；是基底。
多个 Agent: 不是单 agent。单 agent 是 Agent App。
长期共存: 不是一次性会话。时间维度上是常驻。
同一上下文: 不是相互隔离的 N 个对话。状态是共享的。
持续并发: 不是 request-response。多 Agent 并行长时运行。
协调机制: 这是 OS 区别于工具集的关键。

第 II 章

本质：主体的容器

为什么 OS 这个结构在 Agent 时代会再次出现

传统应用是「功能的容器」，AgentOS 是「主体的容器」。

传统应用容纳的是函数、按钮、表单——它们没有意志。AgentOS 容纳的是 Agent——它们能自主行动、有记忆、会冲突、会协作。

这种结构和传统操作系统是同构的。操作系统在计算机历史上一直对应同一件事：管理多个相互独立的主体共存。AgentOS 是这个抽象的延续——只是被管理的对象从"进程"升级成了"具有自主性的 Agent"。

传统 OS	AgentOS
进程（Process）	Agent
调度器（Scheduler）	Orchestrator
内存（Memory）	Context Window
文件系统（File System）	Memory / Skill Library
系统调用（Syscall）	Tool / MCP Call
权限（Permission）	Permission Mode
Shell	Chat / Canvas 界面
多用户（Multi-user）	多 Agent（Multi-agent）

第 III 章

与传统应用的本质差异

不是功能差异，是范式差异

维度	传统应用	AgentOS
主体性	单主体：人是唯一行动者	多主体：人 + N 个 Agent 都是 actor
控制流	User-driven（用户驱动）	Agent-driven + Human-in-loop
时间性	Request-response（即时响应）	Long-running（跨小时/天/项目）
确定性	相同输入 → 相同输出	概率性推理，需要可观测与补偿

任何一条不成立，都不构成 AgentOS——可能是更好的 App、更聪明的助手、更智能的 IDE，但范式上还是传统应用。

最重要的一条是「主体性」。环境里一旦有 ≥2 个 actor，协调问题就出现了——这就是 OS 要解决的事。

第 IV 章

必要条件（5 条）

缺一不可，缺一即退化为 Agent App

1. 多 Agent 编排（Orchestration）

能同时运行 ≥2 个对等 Agent，并管理它们的并发（worktree、隔离 context）、通信（消息、共享 state）、调度（依赖、优先级）。

判别点 · 不是"main agent 临时召唤 subagent"，而是"多个对等 Agent 可以并行长期运行"。

2. 长期记忆与状态持久化（Memory）

跨 session、跨重启、跨设备的"自我"：项目级记忆（约定、约束、历史）、Agent 级身份（人格、风格、偏好）、任务级状态（plan、进度、决策日志）。

判别点 · 关掉重开，Agent 是否记得之前的项目上下文？

3. 资源治理（Resource Governance）

对 Agent 消耗的资源可见、可控、可调度：Context window、Token / cost、Cache hit rate、模型路由。

判别点 · 用户能看到资源消耗并主动调度吗？

4. 可扩展的工具/技能系统（Capability Layer）

Agent 的能力是可注册、可隔离、可复用的：工具协议（MCP 或等价物）、Skill / Prompt 库（个人沉淀）、权限粒度（每个工具的访问范围）。

判别点 · 用户能自己加新能力而不重新打包应用吗？

5. 人机协作协议（Human-in-Loop Protocol）

Agent 自主行动时，人是协作者而不是旁观者：Permission 分级、Approval gate、Interruption、可观测性。

判别点 · Agent 跑飞了你能不能截停、回滚、纠正？

第 V 章

形态光谱（8 档）

AgentOS 是 AI 产品光谱的最右端，实际产品连续分布

传统应用

Office 2010、原 VSCode

无 AI · 单主体 · 即时响应 · User-driven

AI 增强应用

Office 365 + Copilot、Photoshop AI

AI 是 feature · 单主体 + AI 局部工具

AI 原生应用

Cursor、Perplexity、Granola

没 AI 这产品就不存在 · 但仍是 user-driven · 单 agent

AI 助手

ChatGPT、Claude.ai、豆包

对话式 · 单 agent · 浅记忆 · 1 人 + 1 AI

垂直 Agent

Devin、Lovable、Bolt、v0、Manus

第一次"Agent 自己跑" · 长时 · 单 agent · 聚焦特定任务

Agent IDE

Cursor Composer、Claude Code、Codex、Cline

多工具 · 单 session · 1 main + N subagent · 聚焦代码

07
Agent Workbench
Vibe Kanban、constellagent、Spec Kit · 也包括你的项目
多 agent 编排 · GUI 化 · wrapper 现有 agent · 从代码扩展到工作场景

08
AgentOS
Proma、xue/AgentOS
5 项必要条件齐备 · 1 人 + N Agent 长期共存 · 全长时 · 主体协商

关键分水岭

4 → 5　从同步到异步——Agent 第一次有自主时间
6 → 7　从 IDE 到 Workbench——从代码场景扩展到工作场景
7 → 8　从 Workbench 到 OS——从拼接到完备的内核

第 VI 章

参考架构（6 层）

从内核到用户态，从基础设施到应用

User Space · 用户态

Application Agents

用户面对的角色 Agent（CEO、Coder、Reviewer…）

Skill / Tool RegistryMCP

能力市场：可装、可卸、可复用

Memory & Context

状态层：短期 / 长期 / 项目 / 人格

Kernel Space · 内核态

Orchestration

调度：并发、通信、worktree

Agent Runtime

Agent loop、token、采样、流式

Permission & Sandbox

权限、隔离、可观测性

关键判断

只做 Layer 4-5（skill 库 / 应用层 Agent）= Agent 应用集市。
做了 Layer 0-3（权限、内核、调度、状态）= AgentOS。

很多自称 "AgentOS" 的产品其实只做了 Layer 4-5，是个 Agent 应用集市，严格说不是 OS。

第 VII 章

边界（5 条排除性定义）

定义清楚"什么不是"，才能让"什么是"有意义

vs Agent App

Agent App 是单 Agent 解决单领域任务（ChatGPT、Devin、Lovable、v0、Claude.ai）。

检验 · 能否让多个不同角色的 Agent 在同一个项目上协作？不能 → App

vs Agent 框架

Agent 框架是开发库（LangChain、AutoGen、CrewAI、Claude Agent SDK）。

检验 · 是给开发者 import 写代码，还是给最终用户直接打开用？前者是框架，AgentOS 用它当 kernel。

vs 传统 OS + AI

传统 OS + AI 是 Windows + Copilot、macOS + Apple Intelligence、腾讯 Marvis 这类。

检验 · AI 是 OS 的"附加功能"还是"基本单位"？前者是 OS-augmenting Agent App，后者才是 AgentOS。

vs 工作流自动化平台

工作流平台是 n8n、Zapier、Dify。

检验 · 是预定义 DAG 为主，还是 Agent 自主决策为主？前者是 workflow，AgentOS 让 Agent 决定 workflow。

vs AI IDE / Coding Agent

AI IDE 是 Cursor、Claude Code（聚焦代码场景）。

检验 · 脱离代码场景还成立吗？AI IDE 脱离代码就不工作，AgentOS 可以承载非代码任务。

第 VIII 章

判别框架

10 秒判断一个产品的范畴

能同时运行 ≥2 个不同角色的 Agent，并且它们能共享 state 吗？
关掉再打开，Agent 还记得之前的项目上下文 / 决策吗？
能看到并主动控制 token、context、cost 吗？
能自己定义、安装、复用 skill 或 tool 吗？
Agent 执行高风险动作前会停下等人确认吗？

5 / 5AgentOS

3 – 4 / 5AgentOS 雏形 / 半成品（光谱档 6-7）

1 – 2 / 5Agent App（光谱档 3-5）

0 / 5传统应用（光谱档 1-2）

第 IX 章

关键设计概念

三个最容易被误解的设计变量

9.1 人在回路（Human-in-the-Loop）

人在回路 ≠ 人不在。它的真实含义是：

Agent 持续运行的循环中，人在关键节点保留「边际权力」。

回路至少有 4 种类型，对应不同的设计考量：

回路	触发时机	设计核心
Approval Loop 批准	Agent 准备做高风险动作前	风险分级 + 默认行为
Correction Loop 纠偏	Agent 跑偏 / 误解 / 卡住	可观测性 + 可中断
Teaching Loop 教学	任务结束后的反馈	反馈持久化 → memory / skill
Handoff Loop 接管	Agent 能力边界外	优雅交接 + 状态保留

核心设计变量是回路的频率和粒度。高频细粒度 → 安全但烦（approval theatre）；低频粗粒度 → 高效但险。理想态：按风险动态自适应。

这就是为什么 5 级权限模式（Plan / Auto / Default / Accept Edits / Bypass）是 AgentOS 的"宪法层"设计——不是 feature，是主体性的边界协商机制。

9.2 主体性的边界协商

100% 边际权力归人 = 传统应用（没有真正的 Agent）
0% 边际权力归人 = 全自主 Agent（用户失控）
AgentOS = 可协商、可调节的中间地带

人在回路是宪法，权限模式是议会，approval gate 是法律。

9.3 资源治理：AgentOS 区别于 Agent 应用的关键

传统应用的资源是隐式的（CPU、RAM 由 OS 管，用户不感知）。AgentOS 的资源必须是显式的——context、token、cost 都需要用户感知和参与决策。

这是 Claude Code 等单厂商工具结构性做不到的——它们的商业模式反向（鼓励消耗，不鼓励优化）。这一条结构性空白，永远留给 wrapper 层。

第 X 章

命名的诚实辨析

"OS" 这个词是 metaphor，不是技术定义

"AgentOS" 这个词的合适性，取决于用途：

用途	是否合适
行业讨论 / 趋势命名	✓ 合适：简洁、传神
心智模型 / 概念框架	✓ 合适：用 OS 结构思考多 Agent 协调非常有用
早期 indie 项目的产品名	✓ 可用：叙事杠杆 > 承诺风险
成熟 / 商业 / 严肃产品的定位词	⚠ 慎用：承诺过重，限制空间

关键区分：「框架」vs「身份」

框架

用来理解和分析
AgentOS 概念可以作为认识工具，用于设计、判断、对比。

身份

用来自我定位
Workbench / Workstation / Studio 这类词更克制、更准确。

用 AgentOS 框架来理解 / 设计你的产品，但不必把产品命名为 AgentOS。

类比：软件工程师用 OS 原理思考一个 web app 的并发问题，不会把 web app 改名叫 OS。建筑师用城市规划思考小区设计，不会把小区改名叫城市。

框架是认识工具，身份是承诺工具。两者不必相同。

"Workbench" 作为身份词的优势

维度	OS	Workbench
隐喻来源	计算机系统	木工 / 实验室 / 创作
承诺重量	重	轻而克制
单复数	一个就够	可以有多个
工程规模感	团队 / 公司级	个人 / 小团队级
文化根基	"OS" 普遍觉得很重	IBM / Eclipse / Smalltalk · 30 年好传统

第 XI 章

生态位判断

为什么原厂吃不下 AgentOS 全部生态位

AgentOS 不是替代传统应用、不是替代 AI IDE、不是替代垂直 Agent——它是一个新的容器范畴，承载"超级个体在 Agent 时代的工作环境"这个细分需求。

玩家类型	代表	长期定位
原厂内核	Claude Agent SDK、Codex SDK	Layer 1（永远是底层）
原厂应用	Claude.ai、ChatGPT + Operator	消费级 AgentOS（标准化）
大厂第三方	Cursor、Replit Agent	横向整合的 Workbench
超级个体自建	Proma、xue/AgentOS	极致个人化 + 多厂商 + 本地

5 个结构性约束：原厂吃不下全部生态位

商业模式天然反向 · 鼓励 token 消耗 vs 用户要优化
多厂商需求结构性反向 · Anthropic 不会做"路由到 GPT"的功能
DNA 错配 · model lab 做不好桌面工作台体验
Vibe 反规模化 · 大公司必须做最大公约数，无法做高度个人化
开源 / 闭源张力 · SDK 越开放，wrapper 层活得越好

底层平台越成功，上层应用空间越大。
Anthropic / OpenAI 越成功，Workbench 类产品的市场越大。

第 XII 章

开放性与演化

这份定义有时效，也有边界

这份定义的边界条件

时间敏感 · 本定义基于 2026 年 6 月的状态。AgentOS 概念在快速演化，6-12 个月可能出现重要修正。
样本偏向 · 当前案例集中在超级个体自建项目，企业级 AgentOS 形态可能不同。
"AgentOS" 这个词本身可能被取代 · 历史上 "Information Superhighway" → Internet、"Cyberspace" → Web，早期 metaphor 都是过渡命名。
5 个必要条件是必要不充分 · 可能还有第 6、第 7 条我们还没看清。

尚未解决的问题

AgentOS 会不会经历从「个人 OS」到「团队 OS」的演化？
谁会成为 AgentOS 时代的"内核维护者"？（Anthropic / OpenAI / indie 社区共识）
"vibe" 本质上意味着什么？AgentOS 的本质是不是"高度个人化的工作环境"，所以原厂永远做不到位？
AgentOS 需要"用户"这个概念吗？传统 OS 有 root/user 分级；AgentOS 里"人"和"Agent"谁是 root？

AgentOS = 多 Agent × 长期共存 × 资源治理 × 人机协作 × 状态持久化

= 一个让「人 + AI」能像「多人公司」一样长期协作的运行环境。

它是认识 Agent 时代工作环境的有效框架，
但不一定是每个产品需要自我加冕的身份。