什么是 AI 智能体？

概念 · 智能体 AI 详解

什么是 AI 智能体？

你已经知道什么是语言模型：你输入一些内容，它写回一些内容。当你不再让模型只会说话，而是开始让它做事——调用搜索 API、运行代码、编辑文件、订机票——然后根据发生的结果继续行动时，你得到的就是智能体（agent）。本篇要建立的，是本节其余所有内容都依赖的那个核心思维模型：智能体就是被放进一个循环里、配有工具、追求一个无法在单次回复中完成的目标的模型。

STEP 1

先讲教科书定义，再讲现代定义。

经典定义比 LLM 早了几十年。在 Russell 和 Norvig 的《人工智能：一种现代方法》中，智能体是任何通过传感器感知其环境、并通过执行器作用于该环境的事物。恒温器是一个智能体：它感知温度，通过开关加热器来行动。网络爬虫是一个智能体：它感知页面，通过跟随链接来行动。这个定义刻意宽泛，对智能本身只字不提——它只描述感知-行动这个结构。

现代的、LLM 时代的定义把它收窄为某种具体而有用的东西。AI 智能体是：

一个决定下一步做什么的语言模型，
配有一组工具（它可以调用来影响或观察世界的函数），
在一个循环中运行，直到目标达成或某个停止条件触发，
其中每一个下一步由模型决定——不是人类，也不是固定脚本。

最后这一条才是关键所在。如果每个动作都由人类批准，你拥有的是一个助手。如果步骤顺序由固定脚本决定，你拥有的是一个工作流。它之所以成为智能体，恰恰是因为模型才是那个在当下、根据它刚刚观察到的内容、决定接下来发生什么的东西。

一句有用的概括，接近 Anthropic 在《构建有效的智能体》中的表述：智能体是这样一个系统——LLM 自主主导它自己的流程和工具使用，对如何完成任务保持控制权。相比之下，工作流是 LLM 和工具通过预定义代码路径被编排的系统。

STEP 2

把"感知 → 决策 → 行动"讲具体。

剥去行话，智能体就是三个动词不断重复。来看一个真实任务："查清我们的 API 文档是否还在提及已废弃的 v1 端点，如果有，列出相关文件。"

PERCEIVE   The model reads the goal + everything observed so far.
           Right now: just the user's request.

DECIDE     "I can't answer from memory. I should search the
            repository for the string 'v1' in the docs folder."
            → emits a tool call: search_files(query="v1", path="docs/")

ACT        The tool runs. It returns:
            docs/api/auth.md:14
            docs/api/legacy.md:3
            docs/changelog.md:88

PERCEIVE   The model now reads those three hits as new observations.

DECIDE     "Two of these look like real mentions; the changelog is
            historical and fine. I should open the two doc files to
            confirm they describe v1 as current, not deprecated."
            → emits: read_file("docs/api/auth.md")  ... etc.

...        The loop continues until the model decides it has enough
           to answer, then it stops and writes the final list.

注意发生了什么、没发生什么。模型没有预先规划好全部五个步骤。它走了一步，看了结果，然后根据那个结果决定下一步。这种反馈——行动，然后感知后果，然后再决策——就是它的本质特征。一个一次性给出答案的模型，无论多聪明，都不是智能体。一个其下一步取决于上一步实际结果的模型，才是。

STEP 3

每个智能体都有的四个部分。

无论多简单或多精巧，每个智能体都可以分解为同样的四个部分。记住这些名称；本节其余部分都会回头引用它们。

模型（策略）。那个在给定目标和迄今历史后选择下一个动作的 LLM。用强化学习的语言说，这就是策略（policy）：一个从情境到动作的函数。模型的质量是智能体质量的天花板。
工具（执行器）。模型被允许调用的函数：search_web、run_python、send_email、query_database。工具是智能体伸到自身文本之外的方式。没有工具，智能体只能自言自语地思考。
环境。工具所接触的一切：一个代码库、一个浏览器、一个数据库、一个客户的账户、通过机器人接触的物理世界。环境是提供反馈的东西，也是智能体可能损坏的东西——这正是后续篇目要花真功夫讲它的原因。
循环（编排）。那个调用模型、执行模型所请求的工具、把结果喂回去、并决定是继续还是停止的外壳程序。它通常只是包裹在模型外面的一小段普通代码。

当智能体出问题时，这个分解是你的首要诊断工具。最终答案差但工具结果好 → 是模型（策略）。思路对但工具返回了垃圾 → 是工具或环境。步骤都对但它永不停止，或停得太早 → 是循环。说出是哪个部分，问题就解决了一半。

STEP 4

为什么这件事突然变得重要。

感知-决策-行动这个结构已有几十年历史。2023 年前后发生的变化是：语言模型在两件具体的事情上变得足够好，使得这个结构用一个通用大脑（而非手工搭建的逻辑）就能实用化：

读懂杂乱、开放式的观察结果。工具结果很少是干净的。它是一段堆栈跟踪、一段半相关的搜索片段、一个 4xx 错误、一大堆 HTML。早期系统需要程序员预判每一种结果形态。一个有能力的 LLM 能读懂一个意外错误，并合理地决定该怎么办。
在开放空间中选出一个合理的下一步动作。给定一个目标和一个工具箱，模型能提出一个看似合理的下一步，而无需人类事先把那一步枚举出来。这正是让一个智能体能处理其作者从未专门为之写过代码的任务的原因。

把这两点结合起来，你就得到了核心结论：单个模型，配上工具和循环，就能接过一个用英语陈述的模糊目标，并通过一系列自主选择的动作在它上面取得真实进展。这种能力强大且确实有用——而这也恰恰是为什么自主性、停止条件和风险各自有专门篇目的原因。一个自己决定下一步动作、且能作用于世界的实体，从构造上说，比一个只输出文本的实体更难预测和约束。记住这个想法；从某种意义上说，本节其余部分就是对它后果的一次延伸探讨。

"智能体"是本领域被过度使用得最厉害的词之一。厂商把单次脚本化、带一个工具的 LLM 调用叫"智能体"；研究者则把这个词留给具有真正自主控制能力的系统。在本维基中我们始终采用 STEP 1 的精确含义：模型在循环中选择每一个下一步。当你在别处读到"智能体"时，先弄清他们指的是哪一种，再去相信营销说辞。