监督者/工作者编排

G3
深入解析 · 多智能体系统

监督者/工作者编排:真正能上线的那个模式。

监督者/工作者(编排者–子智能体)模式,是截至 2025 年几乎每一个进入生产的多智能体系统背后的拓扑——包括 Anthropic 的研究系统,以及 LangGraph、CrewAI 和 AutoGen 中的默认形态。一个监督者分解任务、派发隔离的工作者、再聚合它们的结果。它之所以有效,是因为它是一个你能推理的星型。本文详细讲解其控制流、如何在不丢主线的前提下分解与聚合,以及它无法摆脱的失败模式:监督者是瓶颈。

STEP 1

控制流是规划 → 派发 → 汇合 → 聚合,每个箭头都是一个设计决策。

监督者持有任务和计划;工作者只持有自己那一片。循环为:监督者把任务分解成子任务,把每个子任务派发给一个全新的工作者,附带受限指令和它所需的最小上下文,在结果上汇合(等待最慢的那个),并聚合成单一答案——若结果不完整可能再循环。工作者彼此从不照面;所有协调都由监督者居中调停。这一调停既是该模式的强项(策略只有一处),也是它的天花板(过载也只有一处)。

# supervisor/worker: scoped dispatch, central aggregate
def supervise(task, budget):
    plan = supervisor.decompose(task)
    jobs = [dispatch(w, sub, budget / len(plan)) for sub in plan]
    done = join(jobs)                         # waits on the slowest
    return supervisor.aggregate(task, done)   # may re-plan if thin
STEP 2

分解质量为下游的一切设定上限。

糟糕的拆分救不回来,再好的工作者也不行。监督者必须产出这样的子任务:独立(没有分支需要另一分支的中间状态——否则你做的是伪装的流水线)、受限(每条指令足够具体,让上下文隔离的工作者无法漂移)、有预算(每个都带 token/步数上限,让扇出无法失控)。生产中最常见的缺陷是模糊的子任务:"研究一下市场"会派生出一个没有停止条件的工作者,把预算烧光后返回一团浆糊。分解才是监督者真正的工作;派发是机械的。

让监督者把子任务作为结构化计划对象发出——id、指令、成功标准、预算——而不是作为它随后还要再解析的自由散文。成功标准正是让工作者知道自己完成了、而不是循环到预算耗尽的依据。

STEP 3

工作者必须上下文隔离,否则你已经扔掉了主要收益。

该模式的可靠性收益在于:工作者看到自己的子任务及其最小上下文——这让它更难被干扰、单次调用更便宜、提示注入面更小。把完整任务或兄弟工作者的输出泄露进每个工作者,会让它们重新耦合、让每个上下文窗口膨胀,并重新引入你拆分本是为了避免的群体思维。把工作者边界当作一个硬接口:进去的是受限指令,出来的是结构化结果,别的什么都不许跨越。

STEP 4

聚合是一个综合步骤,而非拼接。

汇合结果之处,正是多智能体价值兑现或丢失之处。朴素的聚合器把工作者输出粘在一起就返回——这会把工作者之间的每一处矛盾、每一处未填补的空白都暴露出来,把真正的工作推给读者。真正的聚合器会调和:检测工作者之间冲突的论断,解决或标记它们,用重新派发去填补空白,并产出一份连贯的产物。关键在于,聚合器不应需要重新推导工作者做过的事——若需要,说明分解失败了,你白白付了扇出成本。

用字符串拼接实现的"聚合",是该模式最常见的静默失败。它能过演示(在玩具输入上工作者很少冲突),却会在生产中、两个工作者第一次意见相左时失败——系统会自信地把两个矛盾答案缝在一起返回。

STEP 5

监督者既是瓶颈也是单点故障——为它而设计。

每个子任务都要经过一个智能体的上下文去做规划,再经过一个智能体的上下文去做聚合。这把两个阶段串行化在单一资源周围:监督者的上下文窗口限定了它能有意义地规划与调和多少个工作者,它的延迟两次落在关键路径上,它一旦失败整个运行就失败。缓解办法:限制扇出,使聚合器的上下文容得下每个工作者的结构化结果;向上传递紧凑的结构化产物,而非原始抄本;对计划和部分结果做检查点,让监督者崩溃后能续跑而非重启;当扇出超过单个监督者可调和的极限时,转为层级(见 multi-agent-topologies)——有意识地接受那额外的一跳有损。

STEP 6

何时不要使用监督者/工作者。

当子任务并不独立时跳过它(你造了条流水线却管它叫星型)、当聚合离不开重做工作者的推理时跳过(拆分什么也没换来)、或当扇出宽到没有任何单个监督者上下文能调和、而层级那额外的摘要损失反正会污染答案时跳过。监督者/工作者恰恰在分解干净且聚合是真综合时才有回报——这两者中任何一个一旦造假,你就在用一个星型的成本买一个单智能体的质量。