监督者/工作者编排

深入解析 · 多智能体系统

监督者/工作者编排：真正能上线的那个模式。

监督者/工作者（编排者–子智能体）模式，是截至 2025 年几乎每一个进入生产的多智能体系统背后的拓扑——包括 Anthropic 的研究系统，以及 LangGraph、CrewAI 和 AutoGen 中的默认形态。一个监督者分解任务、派发隔离的工作者、再聚合它们的结果。它之所以有效，是因为它是一个你能推理的星型。本文详细讲解其控制流、如何在不丢主线的前提下分解与聚合，以及它无法摆脱的失败模式：监督者是瓶颈。

STEP 1

控制流是规划 → 派发 → 汇合 → 聚合，每个箭头都是一个设计决策。

监督者持有任务和计划；工作者只持有自己那一片。循环为：监督者把任务分解成子任务，把每个子任务派发给一个全新的工作者，附带受限指令和它所需的最小上下文，在结果上汇合（等待最慢的那个），并聚合成单一答案——若结果不完整可能再循环。工作者彼此从不照面；所有协调都由监督者居中调停。这一调停既是该模式的强项（策略只有一处），也是它的天花板（过载也只有一处）。

# supervisor/worker: scoped dispatch, central aggregate
def supervise(task, budget):
    plan = supervisor.decompose(task)
    jobs = [dispatch(w, sub, budget / len(plan)) for sub in plan]
    done = join(jobs)                         # waits on the slowest
    return supervisor.aggregate(task, done)   # may re-plan if thin

STEP 2

分解质量为下游的一切设定上限。

糟糕的拆分救不回来，再好的工作者也不行。监督者必须产出这样的子任务：独立（没有分支需要另一分支的中间状态——否则你做的是伪装的流水线）、受限（每条指令足够具体，让上下文隔离的工作者无法漂移）、有预算（每个都带 token/步数上限，让扇出无法失控）。生产中最常见的缺陷是模糊的子任务："研究一下市场"会派生出一个没有停止条件的工作者，把预算烧光后返回一团浆糊。分解才是监督者真正的工作；派发是机械的。

让监督者把子任务作为结构化计划对象发出——id、指令、成功标准、预算——而不是作为它随后还要再解析的自由散文。成功标准正是让工作者知道自己完成了、而不是循环到预算耗尽的依据。

STEP 3

工作者必须上下文隔离，否则你已经扔掉了主要收益。

该模式的可靠性收益在于：工作者只看到自己的子任务及其最小上下文——这让它更难被干扰、单次调用更便宜、提示注入面更小。把完整任务或兄弟工作者的输出泄露进每个工作者，会让它们重新耦合、让每个上下文窗口膨胀，并重新引入你拆分本是为了避免的群体思维。把工作者边界当作一个硬接口：进去的是受限指令，出来的是结构化结果，别的什么都不许跨越。

STEP 4

聚合是一个综合步骤，而非拼接。

汇合结果之处，正是多智能体价值兑现或丢失之处。朴素的聚合器把工作者输出粘在一起就返回——这会把工作者之间的每一处矛盾、每一处未填补的空白都暴露出来，把真正的工作推给读者。真正的聚合器会调和：检测工作者之间冲突的论断，解决或标记它们，用重新派发去填补空白，并产出一份连贯的产物。关键在于，聚合器不应需要重新推导工作者做过的事——若需要，说明分解失败了，你白白付了扇出成本。

用字符串拼接实现的"聚合"，是该模式最常见的静默失败。它能过演示（在玩具输入上工作者很少冲突），却会在生产中、两个工作者第一次意见相左时失败——系统会自信地把两个矛盾答案缝在一起返回。

STEP 5

监督者既是瓶颈也是单点故障——为它而设计。

每个子任务都要经过一个智能体的上下文去做规划，再经过一个智能体的上下文去做聚合。这把两个阶段串行化在单一资源周围：监督者的上下文窗口限定了它能有意义地规划与调和多少个工作者，它的延迟两次落在关键路径上，它一旦失败整个运行就失败。缓解办法：限制扇出，使聚合器的上下文容得下每个工作者的结构化结果；向上传递紧凑的结构化产物，而非原始抄本；对计划和部分结果做检查点，让监督者崩溃后能续跑而非重启；当扇出超过单个监督者可调和的极限时，转为层级（见 multi-agent-topologies）——有意识地接受那额外的一跳有损。

STEP 6

何时不要使用监督者/工作者。

当子任务并不独立时跳过它（你造了条流水线却管它叫星型）、当聚合离不开重做工作者的推理时跳过（拆分什么也没换来）、或当扇出宽到没有任何单个监督者上下文能调和、而层级那额外的摘要损失反正会污染答案时跳过。监督者/工作者恰恰在分解干净且聚合是真综合时才有回报——这两者中任何一个一旦造假，你就在用一个星型的成本买一个单智能体的质量。