自建 vs 采购 vs 编排

B1
运维 · 经济性与投资回报

自建 vs 采购 vs 编排,问的是你的持久优势落在哪一层,而不是成本。

多数"自建 vs 采购"之争都在错误的轴上较劲——它们拿一次性工程报价对比按席位的授权费,谁数小选谁。真正的决策是:你必须拥有智能体的哪一层,产品才有护城河;哪些层应该租,因为拥有它们买不来任何竞争对手买不到的东西。这一步搞错,你要么以高昂代价重造一件大路货,要么把本该是你护城河的那件东西外包了出去。

STEP 1

这棵决策树有三条分支,不是两条。

当工作流是通用的(客服分诊、会议纪要)、你的差异化在别处时,采购一个成品智能体产品。当智能体的行为本身就是产品,或它触及任何厂商都看不到的数据与判断时,自建编排——团队常忘的那条分支——是当你拥有工作流、数据与评估,但租用模型与运行时:你把基座模型、框架、托管工具组装成一个属于你的系统,而不去写那些已成大路货的部件。在 2025–2026 的实践中,对认真的内部智能体,编排是默认;纯自建只留给你握有专有信号的那个狭窄内核。

STEP 2

每条路都有标称数字略去的隐性成本。

可见的价格是最小的一项。采购隐藏了集成、你必须暴露给厂商的数据,以及当其路线图与你分岔时定制能力的天花板。自建隐藏了评估框架、值班轮岗、模型升级的折腾,以及厂商本可摊到所有客户头上的安全/可观测性栈。编排隐藏了框架锁定,以及那些悄悄长成第二个产品的胶水代码。诚实的比较是资产生命周期内满载的总拥有成本,而不是那张报价单。

# fully-loaded TCO, not the sticker price
buy_tco       = license + integration + data_exposure_risk + customization_ceiling
build_tco     = eng_build + eval_harness + oncall + upgrade_churn + safety_stack
orchestrate_tco = model_usage + framework_lockin + glue_maintenance + eval_harness

# the eval harness is NOT optional on any branch — you always pay it

评估框架出现在每一条分支上。如果你无法度量智能体是否有效,你就无法安全地采购、自建编排——所以无论走哪条路,先把评估建起来。这笔成本不是用来打破平局的;它是前提。

STEP 3

拥有会复利的那一层;租用会大路货化的那一层。

把智能体拆成层:模型、运行时/框架、工具与集成、工作流逻辑、评估、专有数据。底部各层正在快速大路货化、每个季度更便宜——拥有它们是一项贬值资产。顶部各层——你的评估、你对工作流的编码、你的数据——会复利:每一桩事故都让它们更好,且无法迁移给竞争对手。买或租正在变成大路货的;只自建那些运行越久越值钱的。

STEP 4

锁定是你以后才付、却由今天定价的成本。

三个锁定面占主导。模型锁定:调到迎合某一家厂商怪癖的提示与工具 schema,换到任何别家都会无声回退。框架锁定:智能体状态、记忆与控制流用一家厂商的抽象表达,你拔不出来。数据引力锁定:轨迹、评估集、微调语料都以厂商格式存放。缓解之道不是"别用厂商"——而是把可迁移的资产(评估套件、作为数据的提示、模型边界处的一道抽象接缝)攥在自己手里,让换厂商是一个项目,而不是一次重写。

STEP 5

可逆性给决策的权重应大于价格。

一个你能在一个季度内退出的采购决策是廉价保险,哪怕它每月更贵;一个要花两年才能撤销的自建决策很贵,哪怕它每月更便宜。给每条分支按"若判断错了多快能逆转"加权,因为你会经常判断错——工作流、模型前沿、厂商格局都在你脚下移动。优先选在可接受成本下让最多未来决策保持敞开的那条路,而不是本季度数字最小的那条。

  • 逆转便宜、运行也便宜——先采购并学习;有信号了再回头看。
  • 逆转昂贵——只有当这一层确实是你的护城河、且工作流稳定时才自建。
  • 工作流未知——先编排;组装成本买来的是可选性。
STEP 6

什么时候自建是错的答案,哪怕你做得到。

工程团队系统性地过度选择自建,因为自建可读、好玩,而隐性成本落在未来某个季度。如果这一层正在大路货化、如果你在那一层没有专有数据或工作流优势、或者你养不起评估与值班那份永久负担,那么自建就是获取一件大路货最贵的方式。只自建那个作为你持久优势的薄内核;租掉其余的不是技术债,是聚焦。