“关于 AI Agent，你最想知道的 3 个问题——为什么我说”垂直 Agent“是个伪命题”

回答几个读者问题。

1、AI Agent 是否有一个权威的概念？中美两国对这个概念是否有统一的解释？

AI Agent 的定义和国家无关，更多是行业共识的演进。

工作流（Workflow）：通过预定义的代码路径来编排 LLM 与工具的系统。
Agent：由 LLM 动态地指挥自己的流程和工具使用方式的系统，始终由 LLM 来掌控完成任务的方式。

简单来说，工作流是“人写好剧本，AI 照着演”；而 Agent 是“人给个目标，AI 自己想办法”。

从技术实现角度，我比较认同 Simon Willison 提出的简洁定义（https://simonwillison.net/2025/Sep/18/agents/）：

一个 AI Agent（智能体），是为了实现某个目标，循环调用工具的大语言模型。

这个定义抓住了 Agent 的本质——它不是一次性给出答案，而是通过“思考→行动→观察→再思考”的循环，逐步完成任务。目前主流的 Agent 实现，无论是 OpenAI 的还是 Anthropic 的，底层都是这个结构。

当然，不同公司可能会根据产品定位给出略有差异的表述，但核心思想是一致的：Agent = LLM + 工具调用 + 自主决策循环。

大厂在这个时间点密集推出 Agent，核心原因是：Agent 是目前 AI 落地最有价值的方向。

聊天机器人的局限性很明显——它只能“说”，不能“做”。而 Agent 能够：

这意味着 Agent 可以真正替代人完成一部分工作，而不只是辅助回答问题。

编程是 Agent 最先落地的领域。像 Claude Code、Cursor、Codex 这样的编程 Agent，已经能够实实在在地帮开发者完成任务，不只是生成代码片段，而是理解需求、读取项目代码、修改文件、运行测试、修复 bug，整个流程都能自主完成。

去年底开始，“Skills”这个概念开始流行。简单理解，Skills 就是教会 Agent 完成特定任务的“技能包”，一套预设的工具、提示词和工作流的组合。

比如我个人就大量使用 Claude Code 结合各种 Skills 来提升效率：

这些任务以前每个都要花我半小时到几小时，现在几分钟就能完成。顺便说一下，我这几个 skills 都是开源的：https://github.com/JimLiu/baoyu-skills

但 Agent 目前仍处于早期阶段，主要挑战有：

这些问题都在被逐步解决。大厂密集入场，本质上是看到了 Agent 的巨大潜力，想要抢占生态位。谁能率先建立起最多用户的 Agent 客户端和丰富的 Skills 生态，谁就能在下一阶段占据优势。

就像现在 Anthropic 就依赖 Claude Code 抢占了先机和用户心智，大家想到 Coding Agent 先想到 Claude Code，MCP、Skills 的标准也是他们提出来的，开发者们争先恐后的基于他们的标准在构建 Agent 生态。

这个问题需要换个角度来理解。

从技术角度看，Agent 本身没有任何秘密，就像我前面说的，它从技术角度看就是一个循环调用工具的大语言模型。

而模型对所有人来说都是一样的：要么花钱用商业模型（OpenAI、Anthropic、豆包、阿里），要么用 DeepSeek 这样的开源模型。这就像选操作系统，你用 Windows 还是 Linux，大家都能用。

所以，单纯做一个垂直领域的 Agent 很难建立护城河。你今天能做，别人明天也能做，而且可能做得更好。

打个比方：Agent 就像操作系统，无论是通用领域还是垂直领域，操作系统本身都差不多。真正的差异化，是基于操作系统之上的应用。

垂直领域真正的机会在于：

举个例子：一个医疗领域的 Agent 产品，核心竞争力不是“Agent”这层，而是背后接入的医学知识库、与医院 HIS 系统的对接、对诊疗流程的理解、以及多年积累的脱敏病例数据。

所以我的结论是：不要去做“垂直 Agent”，而是用通用 Agent 的能力，去解决垂直领域的问题。 护城河不在 Agent 这层，在你围绕 Agent 构建的数据、工具和行业理解。

以上是我基于一线实践的观察和思考，仅供参考。