“关于 AI Agent,你最想知道的 3 个问题——为什么我说”垂直 Agent“是个伪命题”

作者:

宝玉

“关于 AI Agent,你最想知道的 3 个问题——为什么我说”垂直 Agent“是个伪命题”

回答几个读者问题。

1、AI Agent 是否有一个权威的概念?中美两国对这个概念是否有统一的解释?

AI Agent 的定义和国家无关,更多是行业共识的演进。

目前业界比较认可的定义来自 Anthropic。他们在《Building Effective Agents》(https://www.anthropic.com/research/building-effective-agents)这篇文章中做了一个很重要的区分:

工作流(Workflow):通过预定义的代码路径来编排 LLM 与工具的系统。

Agent:由 LLM 动态地指挥自己的流程和工具使用方式的系统,始终由 LLM 来掌控完成任务的方式。

简单来说,工作流是“人写好剧本,AI 照着演”;而 Agent 是“人给个目标,AI 自己想办法”。

从技术实现角度,我比较认同 Simon Willison 提出的简洁定义(https://simonwillison.net/2025/Sep/18/agents/):

一个 AI Agent(智能体),是为了实现某个目标,循环调用工具的大语言模型。

这个定义抓住了 Agent 的本质——它不是一次性给出答案,而是通过“思考→行动→观察→再思考”的循环,逐步完成任务。目前主流的 Agent 实现,无论是 OpenAI 的还是 Anthropic 的,底层都是这个结构。

Agent 的核心循环

当然,不同公司可能会根据产品定位给出略有差异的表述,但核心思想是一致的:Agent = LLM + 工具调用 + 自主决策循环


2、近期国内外大厂密集推出 AI Agent,为何选择这个时间点?您如何看待 AI Agent 的商业化前景?

大厂在这个时间点密集推出 Agent,核心原因是:Agent 是目前 AI 落地最有价值的方向

为什么 Agent 比聊天机器人更有商业价值?

聊天机器人的局限性很明显——它只能“说”,不能“做”。而 Agent 能够:

  • 调用工具:比如搜索网页、读写文件、执行代码

  • 完成复杂任务:把大任务拆解成小步骤,逐个完成

  • 与外部系统集成:对接企业内部系统、数据库、API

  • 持续运行:不需要人一直盯着,可以在后台自主工作

这意味着 Agent 可以真正替代人完成一部分工作,而不只是辅助回答问题。

Chatbot 与 Agent 的对比

已经跑通的场景:编程领域

编程是 Agent 最先落地的领域。像 Claude Code、Cursor、Codex 这样的编程 Agent,已经能够实实在在地帮开发者完成任务,不只是生成代码片段,而是理解需求、读取项目代码、修改文件、运行测试、修复 bug,整个流程都能自主完成。

正在爆发的方向:Skills 生态

去年底开始,“Skills”这个概念开始流行。简单理解,Skills 就是教会 Agent 完成特定任务的“技能包”,一套预设的工具、提示词和工作流的组合。

Agent 的 Skills 技能包

比如我个人就大量使用 Claude Code 结合各种 Skills 来提升效率:

  • 给文章自动配图(调用图片生成工具)

  • 根据素材生成漫画故事

  • 根据素材自动生成 PPT

  • 自动发布文章到公众号、博客、社交媒体

  • 等等

这些任务以前每个都要花我半小时到几小时,现在几分钟就能完成。顺便说一下,我这几个 skills 都是开源的:https://github.com/JimLiu/baoyu-skills

现阶段的挑战

但 Agent 目前仍处于早期阶段,主要挑战有:

  1. 门槛较高:目前这些能力主要在极客圈子里流行,普通用户上手困难

  2. 安全问题:Agent 需要较高的系统权限才能工作,这带来了安全风险。比如恶意的 Skill 可能窃取数据、攻击系统

  3. 可靠性:Agent 有时会“跑偏”,需要人工干预

这些问题都在被逐步解决。大厂密集入场,本质上是看到了 Agent 的巨大潜力,想要抢占生态位。谁能率先建立起最多用户的 Agent 客户端和丰富的 Skills 生态,谁就能在下一阶段占据优势。

就像现在 Anthropic 就依赖 Claude Code 抢占了先机和用户心智,大家想到 Coding Agent 先想到 Claude Code,MCP、Skills 的标准也是他们提出来的,开发者们争先恐后的基于他们的标准在构建 Agent 生态。

3、通用类 AI Agent 和垂直类 AI Agent,您更看好哪个的商业前景?

这个问题需要换个角度来理解。

Agent 本身难以形成垂直壁垒

从技术角度看,Agent 本身没有任何秘密,就像我前面说的,它从技术角度看就是一个循环调用工具的大语言模型。

而模型对所有人来说都是一样的:要么花钱用商业模型(OpenAI、Anthropic、豆包、阿里),要么用 DeepSeek 这样的开源模型。这就像选操作系统,你用 Windows 还是 Linux,大家都能用。

所以,单纯做一个垂直领域的 Agent 很难建立护城河。你今天能做,别人明天也能做,而且可能做得更好。

真正的机会在哪里?

打个比方:Agent 就像操作系统,无论是通用领域还是垂直领域,操作系统本身都差不多。真正的差异化,是基于操作系统之上的应用。

垂直领域真正的机会在于:

  1. 独有的数据:你有别人没有的行业数据、客户数据、知识库

  2. 专业的 Skills:针对特定行业流程打造的工具和工作流

  3. 深度的集成:与行业内已有系统的对接能力

  4. 领域 Know-how:对行业痛点和流程的深刻理解

举个例子:一个医疗领域的 Agent 产品,核心竞争力不是“Agent”这层,而是背后接入的医学知识库、与医院 HIS 系统的对接、对诊疗流程的理解、以及多年积累的脱敏病例数据。

所以我的结论是:不要去做“垂直 Agent”,而是用通用 Agent 的能力,去解决垂直领域的问题。 护城河不在 Agent 这层,在你围绕 Agent 构建的数据、工具和行业理解。

垂直领域的护城河

以上是我基于一线实践的观察和思考,仅供参考。