role-os

v2.9.1

Published

13 days ago

Role OS — a multi-Claude operating system where 61 specialized roles execute work through contracts, conflict detection, escalation, and structured evidence. 10 team packs, 9 missions including dogfood swarm (multi-pass convergence), deep audit with manif

0High
0Medium
0Low

mikefrilot

role-os agents contracts handoffs review workflow multi-agent ai-workflow developer-tools role-contracts claude multi-claude

一种多 Claude 操作系统的解决方案，它对员工进行管理、分配任务、验证结果并执行工作，通过 61 个专门的角色合同来完成。它创建任务包，从经过评分的角色匹配中组建合适的团队，在执行之前检测出流程中的问题，当工作被阻止或拒绝时自动调整恢复方案，并且要求在每次决策中提供结构化的证据。它包括动态调度功能，可用于处理大规模的任务——一个包含 10 个组件的仓库会自动扩展到 28 个审核步骤，而不是 6 个。

它的作用是什么？

角色操作系统是使用多 Claude 的专业方法。它可以防止通用 AI 工作流程中出现的一些特定问题：

偏离——各个角色各司其职。产品不会重新设计。前端不会重新定义范围。后端不会决定产品的方向。
虚假完成——“完成”的定义是明确的。那些掩盖漏洞、跳过验证或解决不同问题的任务将被拒绝。
污染——分叉或继承的项目会带有身份残留。角色操作系统检测并拒绝项目中术语、视觉效果和思维模式方面的差异。
基于感觉的进度——每次交接都有结构化的流程。每个决策都与证据相关联。“感觉完成了”不是一个有效状态。

它的工作原理

描述您的任务。角色操作系统会自动决定合适的协调级别。

roleos start "fix the crash in save handler"
# → MISSION: Bugfix & Diagnosis (70% confidence)
#   Chain: Repo Researcher → Backend Engineer → Test Engineer → Critic Reviewer

roleos start "add a new export command"
# → PACK: Feature Build (50% confidence)
#   Roles: Orchestrator, Product Strategist, Spec Writer, Backend Engineer, Test Engineer, Critic Reviewer

roleos start "something completely novel"
# → FREE-ROUTING (10% confidence)
#   Hint: Create a packet and run `roleos route` for role-level routing

备用方案：

任务——当任务与经过验证的重复性工作流程（bug 修复、治疗、功能发布、文档、安全、研究、头脑风暴、深度审核、内部测试）匹配时。已知的角色链、工件流程、升级分支和明确的部分定义。
包——当任务属于已知类别，但不是完整的任务形式时。10 个经过校准的团队包，具有自动选择和不匹配保护功能。
自由路由——当任务是新的、混合的或不确定的。对 61 个角色中的所有角色根据任务内容进行评分，并组建一个动态链。

该系统绝不会强行将工作通过错误的抽象层执行。它会解释为什么选择每个级别，并提供替代方案。

只需一条命令即可开始执行：

roleos run "fix the crash in save handler"
# → Created run: run-1234
# → Entry: MISSION (bugfix)
# → Started step 0: Repo Researcher → diagnosis-report
# → Guidance: Required sections: entrypoints, module-map, build-test-commands

roleos next                    # Start the next step
roleos complete diagnosis.md   # Complete the active step with artifact
roleos explain                 # Show full run state and guidance
roleos resume                  # Continue an interrupted run
roleos report                  # Generate completion report
roleos friction                # Measure operator touches

当出现问题时采取的措施：

roleos retry 0                 # Retry a failed step
roleos reroute 1 "Frontend Developer" "UI bug"  # Swap a role
roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
roleos block 2 "waiting for API spec"
roleos reopen 0 "found issue in review"

运行结果会持久保存到磁盘（.claude/runs/），因此中断的会话可以干净地恢复。每个步骤都包含操作员指导：需要生成的内容、必需的部分和停止条件。

在路由完成后：

每个角色都会产生一个交接结果——结构化的输出，其中包含证据项目，以减少下一个角色的歧义。
审核者根据合同进行审查——基于结构化证据（而非印象），接受、拒绝或阻止。
恢复路由自动进行——被阻止或拒绝的工作会被路由到正确的解决者处，并附带原因、恢复类型和所需的工件。

考虑预算的调度

角色操作系统可以在每个调度步骤中咨询本地“令牌预算分析师”，并将建议的支出预测附加到清单中——可以选择启用（ROLEOS_BUDGET_CONSULT），为建议性功能（它绝不会阻止调度），并且在默认情况下会回退到确定性的基线。默认禁用；预测是本地的，并且可以免费运行。请参阅手册。

工具调用监督

角色操作系统会在 PreToolUse 阶段验证并控制工具调用——以确定性的方式进行，并且不会在关键路径上使用模型：

一致性观察器（建议性，允许失败）——一个确定性的模式 + 可计算的合同下限，检查提出的调用是否符合其编目的工具合同，并附加关于已证明不一致调用的建议性结果；它绝不会阻止。可选的 LLM 上限（ROLEOS_CONFORMANCE_CONSULT）处理真正具有语义残留的情况。
能力门控（失败时关闭，可选 ROLEOS_CAPABILITY_GATE，默认关闭）——对不可逆操作进行确定性的最小权限控制（npm/PyPI 发布、gh release、git push、仓库编辑、Pages 部署）。除非主管在 .claude/role-os/capabilities.json 中授予了该操作的能力，否则会拒绝已门控的操作，因此错误的步骤——无论是诚实的错误还是注入的错误——都无法触发未经授权的不可逆操作。这是命名补偿规则的预防性补充。请参阅手册。

船员档案

每个角色都有一个档案——一份角色信息表，同时也是运行时配置。六种能力（严谨性、速度、范围、怀疑精神、自主性、坦诚度）对应着实际的调度参数；一种包含八种类型的性格层（怀疑者、建设者、调查员、特立独行者……），其中包含行为指令；并且每个角色都有一个绘制的肖像和一个等级。将整个船员团队以画廊的形式浏览（dossier/dossier.html）——每个角色的雷达图显示其当前的配置与理想状态之间的差异。

当某个角色拥有档案时，调度系统会注入一个运行姿态——即该性格的行为指令加上来自该角色能力的一行姿态描述——因此，该信息表实际上用于配置该角色。可以选择启用或添加：没有档案的角色将表现得与之前完全相同。请参阅手册。

组织推广状态

整个组织范围内的部署状态（队列、决策、审计记录、每个仓库的锁定数据包）都存储在一个独立的私有组织内部仓库中（role-os-rollout）。这个仓库是产品；那个仓库是运行状态。

内存和连续性

角色操作系统不拥有或复制内存层。在 Claude 项目的内存存在的地方，它就是规范的连续性系统——仓库事实、决策、未完成的任务和治疗历史都存储在那里。

角色操作系统与 Claude 项目的内存集成。它不会取代它。

完整的治疗和发布检查

完整的治疗是 Claude 项目内存中定义的规范的 7 个阶段协议（memory/full-treatment.md）。角色操作系统使用角色合同、交接和审核门控来路由和审查治疗过程——它不会重新定义该协议。

发布检查是在进行完整治疗之前运行的包含 31 个项目的质量闸。在开始任何治疗之前，必须通过 A-D 这四个硬性闸。规范参考：memory/shipcheck.md。

顺序：首先进行发布检查，然后进行完整的治疗。如果没有通过硬性闸，则不能发布 v1.0.0 版本。

包含 61 个角色的目录

该目录将这 61 个角色分为 11 个类别。（Dispatch 使用一套独立的 10 个“团队包”——功能、bug 修复、安全、文档、发布、研究、处理、深度审计、头脑风暴、协作——这些团队包会从这些类别中选择相应的角色。）

| 类别 | 角色 | |--------|-------| | Core (2) | 协调者，批评评审员 | | Product (4) | 产品策略师，反馈整合者，路线图优先级排序者，规范撰写者 | | Engineering (7) | 前端开发人员、后端工程师、测试工程师、重构工程师、性能工程师、依赖关系审计员、安全审查员 | | Design (2) | UI 设计师，品牌守护者 | | Marketing (1) | 发布文案撰写员 | | Treatment (7) | 仓库研究员、仓库翻译员、文档架构师、元数据管理员、覆盖审计员、部署验证员、发布工程师 | | Research (4) | 用户体验研究员、竞争对手分析师、趋势研究员、用户访谈结果综合分析员 | | Growth (4) | 发布策略制定者、内容策略制定者、社区经理、支持问题分流负责人 | | Brainstorm (19) | 背景调查员、用户价值调查员、创意突破调查员、机制调查员、市场调查员、逆向思维调查员、可行性调查员、质量标准调查员、背景分析师、用户价值分析师、机制分析师、定位分析师、逆向思维分析师、标准化者、整合者、产品拓展者、场景拓展者、护城河拓展者、评估者 | | Deep Audit (4) | 组件审计员、测试真实性审计员、接口审计员、审计综合分析员 | | Swarm (7) | 蜂群协调员、蜂群后端代理、蜂群桥接代理、蜂群测试代理、蜂群基础设施代理、蜂群前端代理、蜂群综合分析员 |

每个角色都有完整的合同：任务、适用时机、不适用时机、预期输入、所需输出、质量标准和升级触发条件。每个角色都可以通过 roleos route 命令进行路由，系统可以根据数据包内容推荐任何一个角色。

快速入门

# Install (puts `roleos` on your PATH):
npm install -g role-os

# Scaffold the role spine into your repo:
roleos init
# (one-off alternative without installing: `npx role-os init`,
#  then prefix every command below with `npx role-os` instead of `roleos`)

# Describe what you need — Role OS picks the right level:
roleos run "fix the crash in save handler"
# → Creates run, picks bugfix mission, starts first step with guidance

# Step through:
roleos next                    # Start next step
roleos complete artifact.md    # Complete with artifact
roleos explain                 # Show full state
roleos report                  # Completion report

# Deep audit:
roleos audit manifest --generate   # Create audit-manifest.json
roleos audit                       # Start component-level deep audit
roleos audit status                # Check audit progress
roleos audit verify                # Verify manifest and outputs

# Dogfood swarm:
roleos swarm manifest --generate   # Auto-detect domains from repo structure
roleos swarm                       # Start multi-pass convergence swarm
roleos swarm status                # Check swarm progress by stage
roleos swarm findings              # List findings by severity
roleos swarm approve               # Approve feature gate

# Or go manual:
roleos start "fix the crash"   # Entry decision only (no run)
roleos packet new feature
roleos route .claude/packets/my-feature.md
roleos review .claude/packets/my-feature.md accept

# Explore missions and packs:
roleos mission list
roleos packs list

何时不使用 Role OS

单行修复、拼写错误或明显的 bug
探索性研究，没有明确的输出
可以一个人在 5 分钟内完成的工作
需要在审查流程完成后立即发布的紧急补丁
您希望速度优先于结构的项目

证据

Role OS 已在两个具有不同结构的仓库中的三个试验中得到验证：

试验 001 — 功能开发（Crew Screen、Star Freight）

7 个角色的链条，45 个测试场景，0 个角色冲突
防止来自分支祖先的污染，发现内联发明，揭示了实际的障碍

试验 002 — 集成工作（CampaignState 连接、Star Freight）

5 个角色的链条，解决了架构接口问题，而无需使用虚假信息
反向回退测试证明了实时路径是真实的，而不是占位符

试验 003 — 身份工作（污染清除、Star Freight）

6 个角色的链条，51 个测试场景，包括持久的 CI 污染防御
修复了继承的虚假信息漂移，而不会导致广泛的重新设计

可移植性试验（角色一致性、sensor-humor）

相同的骨干结构，不同的语言/领域/堆栈
只需进行上下文更改即可采用，无需修改核心合同

完整处理 FT-001（portlight-desktop）

使用 Treatment Pack 角色的 7 个阶段的 staffed 处理流程
已证明 Shipcheck 门控有效，没有角色冲突

完整处理 FT-002（studioflow）

使用相同的 Treatment Pack，但仓库结构不同（创意工作区与游戏）
Treatment Pack 可移植——无需修改合同

头脑风暴黄金流程（MCP 服务器市场主题）

9 个角色的链条，4 名分析师并行工作，交叉检查 + 反驳争议图
提出了 4 个挑战，缩小了 3 个主张范围，1 个未解决——健康的压力，而不是僵局
16+ 条追溯链接，从渲染的工件追溯到真相层原子
已证明完整的责任链：真相 → 原子 → 争议 → 合成 → 扩展 → 判断 → 渲染 → 追溯

核心属性

这些是不可谈判的。如果任何更改削弱了它们，请拒绝该更改。

角色边界保持不变
审查具有约束力
升级过程保持诚实
数据包可以进行测试
可移植性需要上下文调整，而不是核心手术

项目结构

role-os/
  bin/roleos.mjs               ← CLI entrypoint
  src/
    entry.mjs                  ← Unified entry: mission → pack → free routing
    entry-cmd.mjs              ← `roleos start` CLI command
    run.mjs                    ← Persistent run engine: create → step → pause → resume → report
    run-cmd.mjs                ← `roleos run/resume/next/explain/complete/fail` + interventions
    mission.mjs                ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
    mission-run.mjs            ← Mission runner: create → step → complete → report
    mission-cmd.mjs            ← `roleos mission` CLI commands
    audit-cmd.mjs              ← `roleos audit` — deep audit entry point with manifest generation
    swarm-cmd.mjs              ← `roleos swarm` — dogfood swarm entry point with domain detection
    swarm/                     ← Domain detection, build gate, evidence persistence bridge
    route.mjs                  ← 61-role routing + dynamic chain builder
    packs.mjs                  ← 10 calibrated team packs + auto-selection
    conflicts.mjs              ← 4-pass conflict detection
    escalation.mjs             ← Auto-routing for blocked/rejected/split
    evidence.mjs               ← Structured evidence + role-aware requirements
    dispatch.mjs               ← Runtime dispatch manifests for multi-claude
    tool-profiles.mjs          ← Per-role tool sandboxing (shared by dispatch + trial)
    state-machine.mjs          ← Canonical step/run transition maps
    artifacts.mjs              ← Per-role artifact contracts + pack handoffs
    decompose.mjs              ← Composite task detection + splitting
    composite.mjs              ← Dependency-ordered execution + recovery + cycle detection
    replan.mjs                 ← Mid-run adaptive replanning
    calibration.mjs            ← Outcome recording + weight tuning
    hooks.mjs                  ← 5 lifecycle hooks for runtime enforcement
    session.mjs                ← Session scaffolding + doctor
    brainstorm.mjs             ← Evidence modes, request validation, finding/synthesis/judge schemas
    brainstorm-roles.mjs       ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
    brainstorm-render.mjs      ← Two-layer rendering: lexical bans, render schemas, debate transcript
  test/                        ← 1435 tests across 65 test files
  starter-pack/                ← Drop-in role contracts, policies, schemas, workflows

安全性

默认情况下，Role OS 仅在本地文件系统上运行。它会复制 Markdown 模板，并将数据包/结果/运行文件写入到您的仓库的 .claude/ 目录中。默认操作不会进行任何网络请求，也不会处理任何敏感信息，也不会收集任何遥测数据。不执行任何危险的操作——所有文件写入操作默认使用“如果存在则跳过”的方式。

有三个可选功能会在您明确启用时连接到网络：

roleos verify-citations — 调用外部 prism CLI，该工具会根据公共 arXiv/Crossref API 解析引用标识符（发送正在验证的引用 ID/URL）。
专家级别 (roleos specialist，已注册的角色）— 将 Dispatch 提示发布到您在 .role-os/specialists.json 中配置的 backend_url（通常是本地模型端点）。
预算/合规性咨询 (ROLEOS_BUDGET_CONSULT / ROLEOS_CONFORMANCE_CONSULT) — 通过 HTTP 将步骤/工具调用上下文发送到本地模型，以获取建议结果。

这三个功能默认情况下都是关闭的，并且会回退到本地确定性行为。有关完整策略，请参阅 SECURITY.md。

操作系统

| 层级 | 它的作用是什么？ | 状态 | |-------|-------------|--------| | Routing | 根据数据包内容对所有 61 个角色进行评分，解释建议，评估置信度 | ✓ 已发布 | | Chain builder | 从已评分的角色中组装出按阶段排序的链条，侧重于数据包类型，而不是模板锁定 | ✓ 已发布 | | Conflict detection | 四次验证：硬冲突、序列、冗余、覆盖差距。修复建议。 | ✓ 已发布 | | Escalation | 自动将被阻止/拒绝/拆分的工作路由到正确的解决者，并提供理由 + 所需的工件 | ✓ 已发布 | | Evidence | 基于角色的结构化证据，包含在结果中。充分性检查。12 种证据类型。 | ✓ 已发布 | | Dispatch | 生成用于 multi-claude 的执行清单。每个角色的工具配置文件、系统提示和预算。 | ✓ 已发布 | | Trials | 完整的角色阵容已得到验证：30/30 个黄金任务 + 5/5 个负面测试。7 个包试验完成。 | ✓ 已完成 | | Team Packs | 10 个经过校准的包，具有自动选择、不匹配保护和自由路由回退功能。 | ✓ 已发布 | | Outcome calibration | 记录运行结果，根据结果调整包/角色权重，并调整置信度阈值。 | ✓ 已发布 | | Mixed-task decomposition | 检测复合工作，将其拆分为子数据包，分配包，并保留依赖关系。 | ✓ 已发布 | | Composite execution | 按照依赖顺序运行子数据包，进行工件传递、分支恢复和综合处理。 | ✓ 已发布 | | Adaptive replanning | 在运行时对范围更改、发现或新需求进行更新，而无需重新启动计划。 | ✓ 已发布 | | Session spine | roleos init claude 会生成 CLAUDE.md、/roleos-route、/roleos-review、/roleos-status 文件。roleos doctor 验证连接。路由卡证明参与度。 | ✓ 已发布 | | Hook spine | 5 个生命周期钩子（SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop）。建议性强制执行：路由卡提醒、写入工具门控、子代理角色注入、完成审计。 | ✓ 已发布 | | Artifact spine | 每个角色的工件合同。包交接合同。结构验证。链完整性检查。下游角色永远不会猜测他们收到的内容。 | ✓ 已发布 | | Mission library | 9 个命名的任务（功能发布、错误修复、处理、文档发布、安全加固、研究启动、头脑风暴、深度审计、内部测试）。每个任务都声明了包、角色链、工件流程、升级分支以及诚实的部分定义。 | ✓ 已发布 | | Mission runner | 创建运行，逐步执行并跟踪状态，完整/失败时进行诚实的报告。阻塞步骤的传播、链外升级警告、最后一步的重新打开。 | ✓ 已发布 | | Unified entry | roleos start 会自动决定任务与包或自由路由之间的关系。带有置信度评分、替代方案和组合检测的回退层级。 | ✓ 已发布 | | Persistent runs | roleos run 创建基于磁盘的运行。resume（恢复）、next（下一步）、explain（解释）、complete（完成）、fail（失败）。干预措施：重新路由、升级、重试、阻止、重新打开。步骤本地指导。摩擦力测量。 | ✓ 已发布 | | Brainstorm | 双层架构：真相（角色原生模式、来源原子、交叉审查争议图）+ 渲染（5 个不同的声音、词汇禁令、辩论记录）。跟踪链接证明每个渲染的声明都映射到一个真相原子。黄金运行已验证。 | ✓ 已发布 | | Deep Audit | 基于清单的代码仓库审计：将代码仓库分解为组件，分派 N 个审核员 + M 个测试真相审核员 + K 个接口审核员，从依赖关系图中进行合成，生成排序后的结论和行动计划。动态分派的规模与代码仓库的大小成比例（公式为 2N + K + 3）。在每个步骤中都进行工件验证，并且是针对运行器的原生支持。 | ✓ 已发布 | | Dogfood Swarm | 多阶段收敛：三个健康阶段（错误/安全 → 主动 → 人性化），然后是功能发布。独占的文件所有权、每个阶段后的构建门控、用户检查点。领域自动检测生成清单。证据桥接至内部测试实验室。 | ✓ 已发布 |

9 个任务

| 任务 | 包 | 角色 | 何时使用 | |---------|------|-------|-------------| | feature-ship | 功能发布 | 5 | 完整的特性交付：范围 → 规范 → 实现 → 测试 → 审查 | | bugfix | 错误修复 | 4 | 诊断根本原因、修复、测试、验证 | | treatment | 处理 | 4 | 代码检查 + 润色 + 文档 + CI 验证 + 审查 | | docs-release | 文档 | 2 | 编写/更新文档，发布说明 | | security-hardening | 安全 | 4 | 威胁建模、审计、修复漏洞、重新审计、验证 | | research-launch | 研究 | 4 | 提出问题、进行研究、记录发现、决定 | | brainstorm | 头脑风暴 | 9 | 结构化的多视角探究，具有可追溯的意见分歧和结论。 | | deep-audit | 深度审计 | 5（等级） | 基于清单的代码仓库审计——工作者数量通过动态分派与代码仓库图成比例。 | | dogfood-swarm | 内部测试 | 8（等级） | 多阶段收敛：健康 A → 健康 B → 健康 C → 功能 → 最终合成 |

每个任务都包含诚实的部分定义——当工作停滞时，系统会记录已完成的内容和剩余内容，而不是虚报完成情况。

头脑风暴任务

不是“AI 头脑风暴”。头脑风暴任务是在法律框架下的专业角色，具有可追溯的意见分歧和产生结论的输出。

roleos run "explore product directions for a developer tool discovery platform"
# → MISSION: Brainstorm (Structured Inquiry)
#   Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge

它与众不同之处：

第一层（真相）： 四位分析师发出角色原生模式（上下文图、用户价值图、机制图、定位图），而不是共享的散文。每个角色都强制执行盲点：禁止使用的短语、禁止的主张类型、过滤后的输入分区。原子携带来源信息。一个有向的交叉审查图生成针对性的挑战。原始分析师在压力下进行辩护、缩小范围或撤回。
第二层（渲染）： 五个不同的声音（边界备忘录、现场笔记、系统草图、主张摘要、交叉审查记录），并带有词汇禁令，以防止声音融合。合成消耗真相，而不是渲染的散文。两层始终可用。
责任链： 每个渲染的句子都可以追溯到真相层的原子。合成方向引用原子。交叉审查的目标是真实的声明 ID。争议图是产品，而不是散文。

已验证： v0.4 黄金运行——完整的责任链已验证。请参阅 examples/golden-run.md 以获取完整的工件链。

深度审计任务

不是表面扫描。深度审计任务将代码仓库分解为有界组件，并根据代码仓库自身的依赖关系图分派专家审核员。

roleos run "deep audit this repo" --manifest=audit-manifest.json
# → MISSION: Deep Audit (Manifest-Scaled)
#   Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps

它与众不同之处：

动态分派： 工作者数量不是固定的。一个包含 10 个组件和 5 个边界集群的代码仓库会产生 28 个步骤（2×10 + 5 + 3）。一个包含 3 个组件的代码仓库会产生 12 个步骤。缩放公式为 2N + K + 3，其中 N = 组件数，K = 边界数。
基于清单的包： 一个 audit-manifest.json 定义了组件（带有文件路径、行数、描述）和边界（从/到，带有接口描述）。每个审核员只收到自己的包。
四种角色原型： 组件审核员（每个模块的代码真相）、测试真相审核员（证明的测试与存在的测试）、接口审核员（来自依赖关系图的集成边界）、审计合成器（所有包的排序结论 + 行动计划）。
在每个步骤中进行工件验证： validateArtifact() 在两个执行路径中的每个步骤完成后都会触发。结果附加到步骤对象。系统知道每个工件是否满足其合同。
诚实的部分： 当预算或范围阻止完成时，每个组件的发现都是单独有效的。系统会从已完成的内容中进行合成，而不是虚报完整的覆盖范围。

已验证： 针对运行器的原生证明运行——对真实的清单进行了 18 个测试，并验证了包括升级重新打开和部分失败在内的完整生命周期。缩放公式已针对 3/6/10/15 组件的清单进行验证。

内部测试任务

这不是一个单次检查的静态代码分析工具。该“蜂群”任务运行一个多阶段收敛协议，通过三个健康阶段和迭代的功能交付，将仓库从“可工作”状态提升到“生产就绪”状态。

roleos swarm
# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
#   Stages: Health-A → Health-B → Health-C → Feature → Final
#   Domain agents: 3-5 parallel per wave (exclusive file ownership)

它与众不同之处：

三阶段健康检查——第一阶段修复错误和安全问题（循环直到 0 个 CRITICAL + 0 个 HIGH）。第二阶段应用主动加固措施（用户审查结果）。第三阶段使代码库更人性化——提供帮助用户的错误消息、重新连接反馈、加载状态、可访问性。每个阶段都是一个不同的视角，而不是重复相同的扫描。
独占文件所有权——每个领域代理通过 swarm-manifest.json 拥有特定的文件。没有两个代理编辑相同的文件。不会发生合并冲突。无需协调开销。
构建门禁——每次迭代后，必须通过代码风格检查 + 类型检查 + 测试。系统自动检测构建系统（Node、Rust、Python、Go），并运行相应的命令。
用户检查点——健康检查 B 阶段和功能交付需要明确的用户批准才能执行。系统会呈现结果，用户决定要构建的内容。
迭代收敛——各阶段与迭代循环交替进行，直到满足退出条件或达到最大迭代次数。每个迭代都会从头开始重新审核，以捕获先前修复引入的回归问题。
领域自动检测——roleos swarm manifest --generate 检测仓库类型（CLI、Web、桌面应用、MCP、单体仓库），并生成不重叠的领域分配。

已验证： claude-collaborate (2026-03-28) — 35→129 个测试，修复了 106 个健康问题，发布了 v1.1.0 版本。协议 v2.0 包含 9 个阶段。

状态

稳定且已发布。请参阅 CHANGELOG 以获取完整的版本历史记录以及每个版本中发生的变化。

许可证

MIT

由 MCP Tool Shop 构建

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme

它的作用是什么？

它的工作原理

考虑预算的调度

工具调用监督

船员档案

组织推广状态

内存和连续性

完整的治疗和发布检查

包含 61 个角色的目录

快速入门

何时不使用 Role OS

证据

核心属性

项目结构

安全性

操作系统

9 个任务

头脑风暴任务

深度审计任务

内部测试任务

状态

许可证