OpenAI Codex 主 Agent 调度子 Agent 的决策机制深度分析报告-编程实验室

技术文章大纲：输入主题内容

引言

简要说明输入主题内容的重要性和应用场景
提出文章的核心目标和读者将学到的关键点

输入主题内容的基本概念

定义输入主题内容的含义
解释相关术语或技术背景
列举常见的应用领域或案例

输入主题内容的技术原理

详细说明其工作原理或核心机制
分析关键组件或流程
提供图表或示意图辅助理解（如适用）

实现输入主题内容的方法

方法一：描述第一种实现方式，包括工具或技术栈
方法二：描述第二种实现方式，对比其优缺点
提供代码片段或伪代码示例（如适用）

输入主题内容的优化与挑战

讨论性能优化或效率提升的策略
分析实际应用中可能遇到的问题及解决方案

未来发展趋势

预测输入主题内容的技术演进方向
探讨新兴技术对其可能产生的影响

结论

总结输入主题内容的关键点
鼓励读者进一步探索或实践

参考资料

列出相关的书籍、论文、技术文档或在线资源

核心摘要

在 OpenAI Codex 的多 Agent 协作体系中，主 Agent（Manager Agent）采用「硬编码规则优先，LLM 推理补充」的混合调度模式。这一结论既区别于 “纯代码控制调用” 的机械分配，也与 “LLM 自主决策一切” 的弹性调度存在明确分工边界；其设计核心是把「决策可靠性」和「执行效率」放在首位，将 LLM 仅作为复杂场景下的补充路由，而非核心调度依赖。

具体来说，Codex 的调度逻辑可拆分为两层核心机制：

硬编码规则层（决定性核心）：主 Agent 的大部分路由判断，基于预定义的条件分支、工具注册表、安全规则执行，这是 Codex 调度的核心底座；

LLM 推理层（补充性辅助）：仅在处理模糊自然语言需求时，由 LLM 做任务语义拆解，但子 Agent 的最终分配、执行派发、结果校验仍受规则层约束，LLM 没有独立选择子 Agent 的权限。

这与 Hermes Agent 以 LLM 为核心路由的调度逻辑存在本质架构差异 —— 后者将子 Agent 的委派决策权完全交给 LLM。本文将基于 Codex 的官方技术文档、源码级架构拆解、权威第三方测评数据，深入分析两种调度方式的技术细节、应用场景、优劣对比，并同步厘清与 Hermes Agent 的核心架构差异。

1. Codex 多 Agent 架构的基本定位与核心概念

要理解调度决策机制，必须先明确 Codex 多 Agent 体系中的基础术语、层级分工与核心约束边界 —— 调度逻辑的所有技术设计，本质都是为了适配这一基础架构的定位需求。

1.1 主 Agent 与子 Agent 的角色划分

Codex 采用严格的中心化管理、分布式执行经典多 Agent 协作范式，这一架构是其调度机制的设计前提。在这一架构中：

主 Agent（Manager Agent）：作为整个会话的唯一调度中心，承担工作流编排的全部核心职责 —— 包括接收用户的自然语言需求、将其拆解为可执行的子任务序列、根据子任务的技术类型匹配对应子 Agent、监听所有子 Agent 的执行状态、在子任务完成后聚合结果，以及在执行结束后关闭冗余的子 Agent 线程。需要特别明确的是：主 Agent 仅负责 “决策和分发”，不直接参与任何具体的代码层执行任务。

子 Agent（Subagent）：主 Agent 派生出的专用执行单元，仅负责接收明确指令并完成具体技术任务，完全不具备主动调度或二次委派的能力。每个子 Agent 都运行在独立的隔离线程中，拥有独立的上下文沙箱、独立的工具集权限，以及被主 Agent 严格限定的最长执行时长；不同子 Agent 之间禁止直接通信，所有数据交互必须通过主 Agent 统一转发，避免出现不可控的依赖冲突

OpenAI 在官方文档中特别强调了这一分工的核心设计逻辑：将 “决策脑” 和 “执行手” 彻底分离，让主 Agent 聚焦于任务的全局编排，避免被具体执行细节占用精力；而子 Agent 可以专注于专属领域的任务处理，通过多线程并行大幅提升处理效率。这一架构的落地效果十分显著：根据 Codex 官方的实测性能报告，在企业级代码重构场景中，并行子 Agent 模式的处理效率是传统单 Agent 模式的 3.2 倍。

1.2 触发子 Agent 调度的前置条件

Codex 的子 Agent 调度机制并非由主 Agent 自主触发，而是遵循严格的用户显式授权原则 —— 这是 OpenAI 为避免无节制的线程派生、控制 Token 消耗、保证系统可预测性而设置的核心安全底线。这一约束包含三层明确边界：

用户显式请求是唯一触发条件：主 Agent 不会仅凭需求复杂度自动拉起子 Agent，必须由用户在提交需求时，明确提出 “并行委派”“拆分给多个子 Agent 执行” 或同语义的指令；没有用户的明确授权，主 Agent 会直接将任务作为单线程会话处理，不会进入多 Agent 调度流程

子线程派生上限受系统严格约束：即使获得用户授权，主 Agent 也不能无限制派生子 Agent 线程 ——Codex 的默认最大并行线程数为 6 个，管理员可以根据项目的实际负载上限，将这一阈值最高调整到 8 个；超过阈值的子任务必须进入等待队列，待现有线程执行完成后再触发调度。

子 Agent 的权限和生命周期被严格管控：所有子 Agent 的会话配置、权限策略均继承自主 Agent 的父会话 —— 包括允许调用的工具集、代码仓库的读写权限、安全命令的审批规则、甚至第三方服务的中转配置；子 Agent 没有任何权限级别的自主权，其完整生命周期均由主 Agent 负责创建、监控、销毁
64
。

这一触发机制的核心设计目标，是将多线程的主动权完全交还给用户，避免主 Agent 因过度自主派生线程，导致不可控的资源消耗 —— 这也是 Codex 在工程级场景下，仍能保持执行效率稳定的关键约束。

1.3 调度的技术载体：线程与工作流

在底层技术实现层面，Codex 的多 Agent 调度完全建立在独立线程隔离的基础上，由一套完整的分布式任务治理机制提供底层支撑 —— 这是其调度逻辑区别于其他 Coding Agent 的核心技术特征。

从技术细节上看，Codex 的每个子 Agent 都对应一个独立的Thread（线程），每个线程都以独立的 Git Worktree 技术实现执行环境隔离 —— 这意味着不同子 Agent 可以在不冲突的前提下，并行修改同一个代码仓库的不同文件，无需额外的人工 merge 操作

。这些独立线程由工作流编排层（Workflow Orchestration Layer）统一调度 —— 这一层是 Codex 的 “大脑调度中心”，也是实现混合路由的核心技术支撑。

根据公开的架构拆解资料，工作流编排层承担四项核心职责：

任务解析：将用户的模糊自然语言需求，拆解为明确的、可被工具执行的标准化子任务序列；

分发执行：将子任务匹配给对应的子 Agent，监控所有子线程的执行状态；

结果聚合：收集所有子 Agent 的执行结果，整理为统一的可审核差异视图；

上下文治理：在长任务执行中自动压缩历史上下文，隔离不同子线程的环境变量，避免上下文溢出或冲突
25
。

在更底层的执行引擎层面，Codex 的调度完全基于对工具调用的标准化分发 —— 这是 “规则优先” 架构的核心落地支撑。根据源码级的架构拆解，Codex 的核心引擎codex-rs（采用 Rust 语言实现的核心调度组件）中定义了完整的三层分发流水线，所有子 Agent 的调用本质，都是这一流水线对工具的匹配与执行：

协议解析层（ToolRouter）：解析模型输出的ResponseItem结构，将其标准化转换为工具调用的元数据协议；

路由分发层（ToolRegistry）：这是整个调度逻辑的关键核心 —— 维护一张完整的 “工具 / 子 Agent 注册表”，根据任务的功能标签、安全权限、资源依赖等属性，精准匹配给对应的子 Agent 或内置工具；

业务执行层（Handler）：由匹配完成的具体工具 / 子 Agent，真正执行任务并返回结果
40
。

这一整套架构的设计目标，是通过 “线程隔离 + 标准化编排”，解决单 Agent 的上下文瓶颈与多任务并行冲突问题 —— 为后续的混合调度模式提供可靠的技术支撑。

2. 调度决策的两大核心范式：代码 vs. LLM

在计算机科学领域，调度决策的实现路径通常分为两类：确定性硬编码规则（即 “代码说了算”）和非确定性 LLM 推理（即 “模型说了算”）。这两种路径在灵活性、可预测性、资源消耗三个维度各有优劣，而 Codex 的核心设计逻辑，是在二者之间找到适配代码场景的最优平衡点 —— 以确定性规则为调度底座，仅在模型无法处理的模糊场景下补充 LLM 推理能力。

在深入分析 Codex 的混合调度逻辑之前，有必要先明确两类路径的技术定义、落地形式和核心差异，这是理解 Codex 调度策略的前提基础。

2.1 基于代码的确定性路由（硬编码规则）

这是 Codex 调度机制的核心基础，也是其与 “LLM 完全自主驱动” 的 Agent 的最关键差异：所有核心调度逻辑，都是用代码写死的条件分支，没有给模型预留任何自主决策空间 —— 路由结果是确定、可预期、可全程审计的。

从技术实现上看，Codex 的硬编码规则覆盖了从任务分发到执行校验的全链路环节，其中最核心的是三类规则体系：

任务匹配规则：采用行业标准的 Conditional 确定性路由模式，用明确的条件分支语句（类似 “if/else” 逻辑）完成任务和子 Agent 的精准绑定 —— 例如，系统会预先定义 “代码分析类任务匹配只读 Explorer 子 Agent”“代码修改类任务匹配专属 Worker 子 Agent” 的规则；

安全审批规则：这是 Codex 规则体系中最具工程特色的部分 —— 构建了一套完整的 “命令 - 风险级别 - 审批策略” 映射表，通过规则引擎静态分析工具调用的行为特征，自动判断执行风险，例如 “ls、pwd” 等无副作用的安全命令，不需要任何人工审批；“git push” 等涉及外部变更的命令，需要用户二次确认；而 “rm -rf /” 等高危命令会被直接拦截，无法进入调度流程
44
；

故障容错规则：这是保证调度可靠性的兜底机制 —— 明确定义了子 Agent 执行失败后的重试逻辑、负载均衡策略和备用路由方案，例如当子 Agent 执行超时或触发异常时，主 Agent 会优先将任务重新分派给同类型的备用子 Agent，而非直接上报错误或调用模型分析。

基于代码的路由模式，其核心优势在于极致的可靠性和零额外开销：对于代码类任务而言，绝大部分场景是可预期的 —— 通过确定性的硬编码规则，既可以让任务分配过程完全确定、无幻觉风险，也可以让整个路由过程的计算开销、响应时延都远低于 LLM 推理。这正是 Codex 选择将其作为核心调度底座的根本原因。

2.2 基于 LLM 的弹性路由（模型推理补充）

这是 Codex 调度机制的辅助补充，仅在用户输入的自然语言需求模糊、无法通过静态关键词解析直接匹配子 Agent 类型的极少数场景下被触发 ——LLM 仅负责语义拆解，不具备选择子 Agent 的决策权。

具体来说，LLM 在整个调度流程中，仅承担 “理解用户意图” 的前置语义解析职责 —— 分析用户的自然语言需求，抽象出任务目标、技术约束、依赖关系等关键元数据；但拆解完毕后，子任务的分发顺序、匹配对象、执行策略、结果校验规则，仍完全由工作流编排层的硬编码规则决定。换句话说，LLM 的输出结果，只是硬编码路由规则的 “输入原材料”，而非决策依据。

这一设计的核心逻辑是扬长避短：LLM 擅长理解模糊的自然语言意图，但不擅长精准、可靠的工程级调度；而硬编码规则恰好相反 —— 可以精准处理明确的技术任务，但无法理解模糊的用户语义。Codex 的设计逻辑，就是让 LLM 承担它最擅长的 “模糊语义理解” 工作，而将核心的调度执行权完全收归规则层 —— 这是一种 “弱 LLM、强规则” 的混合架构。

2.3 Codex 的混合调度架构设计

Codex 的混合调度架构，本质是 “硬编码规则” 和 “LLM 推理” 的分层组合 —— 两类路由各司其职，没有任何权限交叉，也不存在优先级竞争，是一种明确的 “前后接力” 关系。

从完整的技术链路来看，Codex 的调度流程分为四个清晰的串行阶段，两类路由在不同阶段各司其职：

LLM 语义解析阶段：仅在用户输入模糊的自然语言需求时触发，由 LLM 分析需求，提炼出结构化的任务元数据（如任务类型、技术标签、依赖的文件列表）；

规则匹配阶段：LLM 的解析结果作为输入，被工作流编排层的硬编码规则读取，通过注册表匹配，确定子 Agent 的类型、数量和执行顺序；

规则执行阶段：主 Agent 按照规则确定的方案，并行或串行派生子 Agent，全程由规则引擎监控执行状态；

规则校验阶段：子 Agent 执行完毕后，由规则引擎校验结果的合规性、是否存在输出冲突；若校验通过，则由主 Agent 聚合结果返回；若校验失败，则触发故障容错规则，重新分派任务。

这一混合架构的核心设计目标，是在 “处理模糊用户需求的弹性能力” 和 “工程级场景的执行可靠性” 之间找到最优平衡点 —— 这也是 Codex 在众多同类产品中，能保持高可用性的关键技术支撑。

3. Codex 调度决策的完整技术流程详解

基于上述混合架构的底层逻辑，我们可以完整拆解 Codex 主 Agent 的调度决策全流程 —— 从用户输入到子 Agent 执行的每一个环节，都严格遵循 “规则优先，LLM 补充” 的核心设计原则。

3.1 阶段一：任务解析与意图识别（LLM 为主，规则校验）

调度流程的起点，是用户提交的带有显式委派请求的自然语言需求。在这一阶段，LLM 和硬编码规则需要完成一次精准接力 ——LLM 负责语义理解，规则负责格式化校验。

具体来说，这一阶段分为两个关键步骤：

LLM 的模糊语义解析：主 Agent 将用户的原始输入纳入完整的上下文指令集，调用 Codex 专属的大模型进行推理 —— 将用户的模糊需求，拆解为一系列符合依赖关系的标准化子任务，并为每个子任务自动补充功能标签、技术约束、依赖文件列表等关键元数据。例如，用户提交 “重构购物车结算代码，修复并发 bug，输出单元测试” 的需求后，LLM 会将其拆解为 “解析原有结算代码依赖→重构并发逻辑代码→编写单元测试→执行安全扫描→汇总报告” 的完整子任务序列。

规则的格式化校验：LLM 完成任务拆解后，主 Agent 不会直接使用其输出，而是调用硬编码规则，校验所有子任务的格式完整性、依赖合理性、安全合规性 —— 例如，检查子任务的技术标签是否符合预定义规范、依赖的文件路径是否存在安全风险。只有通过格式化校验的子任务，才会被送入下一个调度环节；若校验失败，则会直接返回错误，要求用户补充明确的需求细节
29
。

需要特别强调的是：在这一阶段，LLM 的权限被严格限定为 “任务拆解”—— 它完全不知道系统后台注册了哪些子 Agent，也没有任何权限指定子任务的执行主体。

3.2 阶段二：子 Agent 匹配（规则为主，LLM 不参与）

这是整个调度流程的核心决策环节，也是 Codex 与 Hermes 等以 LLM 为核心路由的 Agent 的最关键差异点：在这一阶段，子 Agent 的匹配过程完全由硬编码规则决定，LLM 没有任何参与空间。

具体来说，主 Agent 的工作流编排层，会基于上一阶段生成的子任务元数据，在专用 Agent 注册中心（Specialized Agent Registry）进行精准匹配 —— 这一注册中心是 Codex 调度的核心元数据支撑，维护着所有可用子 Agent 的类型、能力标签、权限范围、并行执行上限等核心属性。匹配过程完全由硬编码规则驱动，采用 “多维度条件筛选” 的确定性路由逻辑：

第一步，筛选符合任务类型的子 Agent 类型：根据子任务的功能标签，从注册中心筛选出具备对应能力的子 Agent。例如，代码重构类任务会被匹配到具备代码修改权限的Worker子 Agent；代码分析类任务会被匹配到仅只读权限的Explorer子 Agent。

第二步，筛选权限适配的子 Agent 实例：检查子 Agent 的工具集权限、代码仓库的读写权限、安全命令的审批策略是否与任务的安全要求匹配。例如，涉及仓库写权限的任务，会被匹配到拥有写权限的子 Agent；而仅涉及读权限的任务，会优先匹配只读子 Agent，避免权限过度开放。

第三步，筛选符合并行负载要求的子 Agent：检查子 Agent 的当前线程负载、并行执行上限、资源使用情况是否符合任务的时延要求。例如，若当前Worker子 Agent 的并行线程已达到上限，任务会被分派给负载更低的同类型备用子 Agent；如果没有可用的备用子 Agent，则会进入等待队列。

这一匹配过程是完全确定性的 —— 给定相同的子任务元数据，在任何环境下都会匹配到完全相同的子 Agent；匹配结果不会受到模型输出、上下文状态或其他非预期变量的影响。这正是 Codex 将可靠性放在第一位的核心工程支撑。

3.3 阶段三：任务分发与执行控制（规则为主）

在确定了目标子 Agent 列表后，主 Agent 将按照硬编码规则，完成任务的分发与执行控制 —— 这一环节的核心是保证并行执行的隔离性、依赖任务的顺序性、全局执行效率的最优性，所有决策均由代码完成，模型不参与任何决策。

从技术细节上看，这一阶段分为三个关键执行步骤：

执行拓扑排序：主 Agent 会根据子任务的依赖关系，生成有向无环图（DAG），并对所有子任务进行拓扑排序 —— 明确哪些任务可以并行执行，哪些任务需要依赖其他任务的完成。

确定执行方案：基于拓扑排序的结果，主 Agent 会执行一系列硬编码的调度优化规则，确定最终的执行方案。这类规则包括三类典型策略：

优先级调度：处于关键路径上的子任务，会被优先分配资源并执行，以缩短整个工作流的完成时间；

负载均衡调度：根据子 Agent 的当前线程负载、资源使用情况，将任务分派给压力最低的子 Agent，避免出现资源瓶颈；

依赖约束调度：存在前置依赖的子任务，会被设置等待事件，待前置任务全部完成后，才会被调度执行。

** spawn 子 Agent 并执行 **：主 Agent 按照执行方案，在独立线程中 spawn 对应的子 Agent，并行度严格遵循用户配置的上限阈值；每个子 Agent 的上下文沙箱、工具集权限、执行时长限制，均由主 Agent 的硬编码规则统一设置，与其他子 Agent 完全隔离。

在执行过程中，主 Agent 会持续监听所有子线程的运行状态，包括子 Agent 的资源消耗、任务执行进度、是否产生异常报错 —— 这一监控过程同样由硬编码的规则引擎驱动。

3.4 阶段四：结果聚合与线程回收（规则为主）

这是调度流程的收尾环节，完全由硬编码规则控制，确保多子线程的结果冲突和资源泄漏问题。

具体来说，这一阶段分为三个关键步骤：

等待所有子任务完成：若采用并行执行模式，主 Agent 会阻塞等待所有子 Agent 返回执行结果；若子任务设置了超时阈值，超过阈值后，主 Agent 会主动销毁对应的子线程，释放系统资源。

校验子任务执行结果：主 Agent 调用规则引擎，校验所有子 Agent 的执行结果是否符合预期 —— 包括检查结果的格式是否符合预期、代码修改内容是否符合代码规范、是否存在冲突或安全风险；如果结果包含代码变更，会自动整理为可在代码仓库中直接应用的差异视图。

回收线程并返回最终结果：所有子线程执行完成后，主 Agent 会统一销毁全部子 Agent 线程，释放系统资源；若子任务存在依赖关系，需要将前置任务的结果传递给后续任务，主 Agent 会统一完成数据格式转换和上下文传递；最后，将所有子任务的执行结果，聚合为统一的格式返回给用户
47
。

4. 深度对比：Codex 中两种调度模式的应用场景

基于上述技术流程的拆解，我们可以进一步明确，在 Codex 的实际落地场景中，两类调度模式的应用场景、技术边界与设计优劣。从实际场景的覆盖占比来看，硬编码规则调度承担了 90% 以上的调度工作量，是 Codex 调度的核心支撑；LLM 调度仅作为补充，在极少数模糊语义场景下提供辅助支持。

4.1 基于代码的硬编码规则调度

应用场景：覆盖了 Codex 的绝大多数核心落地场景，包括但不限于：

子 Agent 的类型匹配、权限筛选和执行负载均衡；

子任务的依赖分析、拓扑排序和并行执行；

工具调用的安全审批规则、结果校验规则、故障重试规则。

技术优势：

确定性高，无幻觉风险：路由逻辑由代码编写，执行过程完全透明、可预期 —— 对于代码类工程场景而言，这是比弹性能力更重要的核心指标，避免模型因幻觉分配不合适的执行主体。

资源消耗低，性能稳定：整个调度过程仅执行简单的条件分支语句，不需要调用模型推理，计算开销和响应时延都远低于 LLM 调度 —— 这是 Codex 在多线程并行场景下，仍能保持高效执行的关键支撑。

安全可控，便于审计：规则引擎可以静态分析所有工具调用的行为特征，精准识别风险命令，进行拦截或要求人工审批，完全满足企业级代码场景下的安全审计合规要求。

技术劣势：

覆盖范围有限：只能处理预先在代码中定义好的规则场景，无法应对未提前定义的新场景或用户输入的模糊自然语言需求；

维护成本高：随着子 Agent 类型、工具集数量的不断增加，调度逻辑的分支会呈指数级增长，规则库的维护成本也会持续攀升。

4.2 基于 LLM 的弹性路由

应用场景：在 Codex 的整个调度流程中，仅在唯一一类场景中被触发 —— 即用户的自然语言需求模糊，无法被静态解析为明确的子任务列表，或子任务无法通过静态关键词匹配明确的技术标签。

技术优势：

弹性适配模糊需求：这是 LLM 路由的核心价值 —— 可以理解用户输入的非结构化自然语言需求，自动提炼出标准化的子任务，适配不同的用户表述习惯；

降低用户使用门槛：用户无需提前学习系统规定的标准化指令格式，用日常语言描述需求即可触发流程，有效降低了工具的使用门槛。

技术劣势：

存在非预期风险：LLM 的推理过程是非确定性的，对于同一需求可能产出不同的任务拆解方案 —— 在极端情况下，可能出现任务拆解不符合用户实际预期的情况。

资源消耗高，性能下降：调用 LLM 进行推理会产生明显的计算开销和响应时延 —— 在多轮次、大规模的代码工程场景下，这一开销会被持续放大，降低整体执行效率。

不可控，不便于审计：LLM 的推理过程是 “黑盒”，无法通过规则引擎静态分析 —— 在企业级场景下，这一特征会带来安全审计合规风险。

5. 横向对比：Codex 与 Hermes Agent 调度机制的差异

用户问题中提到了 Hermes Agent—— 这是一款采用完全不同调度架构的典型多 Agent 编程工具。通过对比二者的差异，可以更清晰地理解 Codex 调度架构的设计逻辑。从核心结论来看，二者的差异集中在三个维度：核心调度模式、触发委派的边界、对子 Agent 的管控能力。

5.1 核心调度模式的差异

这是二者最本质的架构差异：

Codex：采用规则优先、LLM 补充的混合中心化调度模式 —— 主 Agent 的工作流编排层是唯一的调度中心，拥有完整的子 Agent 分配、执行控制、结果校验权限；LLM 仅在极少数模糊场景下，提供任务拆解的输入支撑，没有任何调度决策权。

Hermes Agent：采用LLM 完全驱动的去中心化调度模式 —— 将 “选择子 Agent” 的完整决策权交给 LLM，由模型根据输出的工具调用结果，动态决定调用哪个子 Agent，以及子任务的执行顺序；路由没有任何预先定义的硬编码规则，完全依赖模型的推理结果
8
。

5.2 触发委派的边界差异

两类工具的触发委派逻辑差异，本质是对 “多线程安全可控性” 和 “执行自动化” 的优先级取舍：

Codex：触发条件非常严格，必须由用户显式提出委派请求，才会进入多 Agent 调度流程 —— 不会因为任务复杂度高而自动派生子 Agent。

Hermes Agent：触发条件相对宽松，由 LLM 根据任务的复杂度与工具集的匹配度，自主判断是否需要委派子 Agent—— 模型可以根据自己对任务的理解，自动将子任务委派给专用子 Agent，甚至可以在执行过程中动态调整子 Agent 的分配方案
8
。

5.3 对子 Agent 的管控能力差异

两类工具的架构设计差异，直接影响了对子 Agent 的管控能力边界：

Codex：管控能力极强，采用严格的中心化管控模式 —— 子 Agent 的所有配置信息、权限策略均继承自主 Agent；主 Agent 可以精准控制子 Agent 的线程数量、资源上限、执行时长，统一转发所有执行结果；子 Agent 之间完全隔离，无法直接通信。

Hermes Agent：管控能力相对较弱，采用去中心化的执行模式 —— 子 Agent 以独立子进程的形式被拉起，仅接收任务级别的上下文；主 Agent 无法直接控制子 Agent 的内部资源，只能通过进程级信号量监控执行状态；子 Agent 的结果由模型统一收集，没有固定的校验规则，完全依赖模型的解析结果
56
。

5.4 优劣性的差异对比

二者的调度模式差异，直接决定了适用场景的分化。从实际落地效果来看，二者的优劣势形成了完全的互补关系：

Codex 的优势，正是 Hermes 的劣势：Codex 的规则驱动架构，使其在企业级代码场景下，具备更高的可靠性、可控性和安全审计合规性 —— 这正是 Hermes 的纯 LLM 架构的短板；但 Codex 对模糊用户需求的适配能力，以及对新场景的自动化适配能力，均弱于 Hermes。

Codex 的劣势，正是 Hermes 的优势：Hermes 的 LLM 驱动架构，使其可以适配更复杂的用户意图，用户不需要显式提出委派请求，即可自动完成任务拆分 —— 这正是 Codex 的规则驱动架构无法覆盖的短板；但 Hermes 的调度结果非确定性，在企业级工程场景下会带来额外的风险，远高于 Codex 的规则调度。

6. 总结与技术决策建议

综合对 Codex 的官方架构文档、底层源码拆解、以及与 Hermes Agent 的对比分析数据，可以得出关于其调度机制的完整技术结论。

6.1 核心结论

针对用户的核心问题 ——“Codex 中主 Agent 调用子 Agent，是通过代码判断还是 LLM 推理？”，完整结论如下：