Manus 谈 AI Agent 之道：做对一千件小事，比做对三件大事更重要

张小珺这期采访Manus联合创始人兼首席科学家季逸超（Peak）的访谈张小珺Benita的微博音频挺值得听听的。

访谈地址：https://www.xiaoyuzhoufm.com/episode/695331cb2db086f897b50ea9

里面有一句话给我印象挺深刻：“做对一千件小事，比做对三件大事更重要”。

熟悉苦涩的教训《The Bitter Lesson》的应该能理解这句话的含义。

AI 研究的历史反复证明，那些依赖人类精心设计的规则和知识的方法，最终都会被更简单粗暴能更好利用算力进行通用学习的方法打败。

换句话说，与其让人类专家花大力气设计聪明的规则，不如让机器自己去学。

Peak 把这个道理翻译成一句话：做对一千件小事，比做对三件大事更重要。

《The Bitter Lesson》应该也深刻影响了 Manus 团队在 Agent 设计上做出的选择。

现在市面上的 Agent 产品，大致可以分成两类。

一类是“规则主导”的 Agent。开发者提前设计好工作流程：第一步做什么，第二步做什么，遇到什么情况走哪个分支。这种 Agent 的好处是可控、可预测，坏处是只能处理设计者预见到的情况。

另一类是“智能主导”的 Agent。不预设具体流程，让模型自己判断每一步该怎么走。这种 Agent 的好处是灵活、能处理意外情况，坏处是不够稳定，有时候会犯蠢。

Manus 选择的是后者。

Peak 在播客中解释这个选择时说，规则主导的 Agent Workflow 在可复现性上确实表现更好。同样的输入，每次都能得到差不多的输出。但他认为这个问题是可以解决的，而规则主导的天花板问题是解决不了的——你永远没办法提前预见用户会遇到的所有情况。

Manus 怎么做到“不设规则”的？

Peak 举了一个例子。大部分互联网服务并没有接入 MCP。如果 Manus 只能用 MCP，那能干的事情就很有限。

Manus 的策略是做降级处理。如果有 MCP 接入，直接用。如果没有 MCP 但有 API 文档，Manus 会自己去读文档，学会怎么调用这个 API。如果连 API 都没有，只要这个服务有网页界面，Manus 就用浏览器模拟人类的操作方式来使用它。

这意味着，开发者不需要专门为 Manus 做任何适配。只要一个服务是给人用的，Manus 就能想办法用上。

“它没有人为设定的约束，完成任务的所有过程和方式，都由智能本身决定。”

这就是“做对一千件小事”的含义。不是提前设计三条聪明的规则，而是让系统在面对一千种不同情况时，每次都能做出还算合理的判断。单看每一次判断，可能都不完美；但整体叠加起来，能处理的问题范围就远超任何规则系统。

这个选择背后是相信模型能力会持续变强。

如果模型能力停滞不前，那“智能主导”的路线就很危险。模型犯蠢的概率不会下降，用户体验永远不稳定。

但如果模型能力持续提升，这条路线的天花板就会不断抬高。今天模型可能在某些任务上判断失误，明天换一个更强的模型，同样的代码就能做对更多事情。

Peak 说，对 Manus 这样的应用公司来说，所有外部的模型创新都是养料和供给。他们不需要参与“模型大乐透”，不用押注哪家模型公司会赢。谁进步了，他们就受益。

这也是为什么 Manus 选择不自己训模型。他们把精力花在“怎么更好地使用模型”上，而不是“怎么训出更好的模型”。后者需要巨大的资源投入，而且有可能押错方向；前者的风险小得多，只要整个行业在进步，他们就能跟着进步。

另外 Manus 团队在 Agent 上的摸索，确实是业界顶级的，而且他们会选择将摸索出来的经验分享出来。比如那篇《AI 智能体的上下文工程：构建 Manus 的经验教训》我就看了很多遍，还有后来那篇和 LangChain 一起做的《Context Engineering for AI Agents with LangChain and Manus》分享，也特别好。

所以 Peak 说当他们读到一些模型公司发布的研究博客时，心情是“既开心又无奈”。开心是因为这些博客验证了他们的方向，无奈是因为博客里写的东西，基本都是他们早就在做的。

比如 Anthropic 提出的“thinking tool”概念，是在 Manus 上线一个月后才发布的。还有用代码方式调用 MCP、渐进式披露信息这些做法，Manus 也早就在用了。

这些 Agent 上摸索出来的经验，你要说创新也算不上多大，更多是一个个具体的工程细节。单拎出来看，每一个都不起眼，但叠加在一起，就构成了产品的核心竞争力。

Peak 把这种方法论总结为：做对一千件小事，比做对三件大事更重要。

三件大事可能是：设计一个天才的架构，发明一个突破性的算法，或者抢先拿到某个独家资源。这些事情如果能做成，当然很厉害，但风险也很高，而且往往不可复制。

一千件小事是：在每一个具体场景里做出合理的判断，处理好每一个边界情况，让每一次用户交互都顺畅一点点。这些事情每一件都不难，但需要耐心和积累，而且门槛会随着积累越来越高。

很多人觉得 Manus 不过是“套壳”，但你要真去做一个 Manus 出来，就会发现这个壳里藏着一千个细节：怎么让模型长时间保持注意力、怎么压缩和恢复记忆、怎么在没有 API 的时候优雅降级、怎么节约 Token 成本、怎么处理各种意想不到的边界情况。每一个细节都不算什么大发明，但每一个都要做对。

这可能就是“套壳”的门槛所在，不在于壳本身，在于壳里那一千件小事。