自建 vs 采购 vs 编排

运维 · 经济性与投资回报

自建 vs 采购 vs 编排，问的是你的持久优势落在哪一层，而不是成本。

多数"自建 vs 采购"之争都在错误的轴上较劲——它们拿一次性工程报价对比按席位的授权费，谁数小选谁。真正的决策是：你必须拥有智能体的哪一层，产品才有护城河；哪些层应该租，因为拥有它们买不来任何竞争对手买不到的东西。这一步搞错，你要么以高昂代价重造一件大路货，要么把本该是你护城河的那件东西外包了出去。

STEP 1

这棵决策树有三条分支，不是两条。

当工作流是通用的（客服分诊、会议纪要）、你的差异化在别处时，采购一个成品智能体产品。当智能体的行为本身就是产品，或它触及任何厂商都看不到的数据与判断时，自建。编排——团队常忘的那条分支——是当你拥有工作流、数据与评估，但租用模型与运行时：你把基座模型、框架、托管工具组装成一个属于你的系统，而不去写那些已成大路货的部件。在 2025–2026 的实践中，对认真的内部智能体，编排是默认；纯自建只留给你握有专有信号的那个狭窄内核。

STEP 2

每条路都有标称数字略去的隐性成本。

可见的价格是最小的一项。采购隐藏了集成、你必须暴露给厂商的数据，以及当其路线图与你分岔时定制能力的天花板。自建隐藏了评估框架、值班轮岗、模型升级的折腾，以及厂商本可摊到所有客户头上的安全/可观测性栈。编排隐藏了框架锁定，以及那些悄悄长成第二个产品的胶水代码。诚实的比较是资产生命周期内满载的总拥有成本，而不是那张报价单。

# fully-loaded TCO, not the sticker price
buy_tco       = license + integration + data_exposure_risk + customization_ceiling
build_tco     = eng_build + eval_harness + oncall + upgrade_churn + safety_stack
orchestrate_tco = model_usage + framework_lockin + glue_maintenance + eval_harness

# the eval harness is NOT optional on any branch — you always pay it

评估框架出现在每一条分支上。如果你无法度量智能体是否有效，你就无法安全地采购、自建或编排——所以无论走哪条路，先把评估建起来。这笔成本不是用来打破平局的；它是前提。

STEP 3

拥有会复利的那一层；租用会大路货化的那一层。

把智能体拆成层：模型、运行时/框架、工具与集成、工作流逻辑、评估、专有数据。底部各层正在快速大路货化、每个季度更便宜——拥有它们是一项贬值资产。顶部各层——你的评估、你对工作流的编码、你的数据——会复利：每一桩事故都让它们更好，且无法迁移给竞争对手。买或租正在变成大路货的；只自建那些运行越久越值钱的。

STEP 4

锁定是你以后才付、却由今天定价的成本。

三个锁定面占主导。模型锁定：调到迎合某一家厂商怪癖的提示与工具 schema，换到任何别家都会无声回退。框架锁定：智能体状态、记忆与控制流用一家厂商的抽象表达，你拔不出来。数据引力锁定：轨迹、评估集、微调语料都以厂商格式存放。缓解之道不是"别用厂商"——而是把可迁移的资产（评估套件、作为数据的提示、模型边界处的一道抽象接缝）攥在自己手里，让换厂商是一个项目，而不是一次重写。

STEP 5

可逆性给决策的权重应大于价格。

一个你能在一个季度内退出的采购决策是廉价保险，哪怕它每月更贵；一个要花两年才能撤销的自建决策很贵，哪怕它每月更便宜。给每条分支按"若判断错了多快能逆转"加权，因为你会经常判断错——工作流、模型前沿、厂商格局都在你脚下移动。优先选在可接受成本下让最多未来决策保持敞开的那条路，而不是本季度数字最小的那条。

逆转便宜、运行也便宜——先采购并学习；有信号了再回头看。
逆转昂贵——只有当这一层确实是你的护城河、且工作流稳定时才自建。
工作流未知——先编排；组装成本买来的是可选性。

STEP 6

什么时候自建是错的答案，哪怕你做得到。

工程团队系统性地过度选择自建，因为自建可读、好玩，而隐性成本落在未来某个季度。如果这一层正在大路货化、如果你在那一层没有专有数据或工作流优势、或者你养不起评估与值班那份永久负担，那么自建就是获取一件大路货最贵的方式。只自建那个作为你持久优势的薄内核；租掉其余的不是技术债，是聚焦。