Cat Wu 面试了几百个 PM 候选人,几乎没人答对一个问题:AI 产品经理到底应该干什么?

作者:

宝玉

Cat Wu 面试了几百个 PM 候选人,几乎没人答对一个问题:AI 产品经理到底应该干什么?

Cat Wu 是 Anthropic Claude Code 和 Cowork 的产品负责人,和 Boris Cherny 搭档,带着团队把产品功能的交付周期从半年压到了一天。在 Lenny's Podcast 最新一期中,Cat 聊了 Anthropic 内部的速度文化、PM 角色的剧变、源代码泄露的善后,以及那个让开源社区炸锅的 OpenClaw 封堵决定。


原始视频:https://www.youtube.com/watch?v=PplmzlgE0kg

要点速览

AI PM 从路线图到发布加速器的手绘信息图

  • 大多数 PM 候选人仍然在用 6-12 个月路线图的思维找工作,Anthropic 的节奏是一周甚至一天发布一个功能
  • Claude Code 团队几乎所有 PM 都有工程背景或直接写代码,设计师也曾是前端工程师
  • Anthropic 用 research preview 机制降低发布承诺,让工程师可以端到端完成从想法到发布的全流程
  • Cat 花 30% 的时间故意把 Cowork 推到极限,和模型对话搞清楚它为什么犯错
  • Claude Code 源代码泄露经过两层人工审查仍然漏过,Cat 定性为流程失败
  • 封堵 OpenClaw 使用订阅配额的决定,Cat 从容量管理角度解释,但回避了“先复制功能再封堵”的争议
  • Anthropic 成功的核心:统一使命让团队愿意牺牲自己的 KR 去服务公司整体目标

1. 与 Boris Cherny 搭档:80% 心灵感应,20% 各干各的

Cat 和 Boris 的 80% 心灵感应协作图

Lenny 开场就问 Cat 和 Boris 是怎么分工的。Boris 是 Claude Code 的创造者和技术负责人,在播客界已经是明星级人物,Lenny 说他的那期节目是播客史上最受欢迎的一集。

Cat 说自己和 Boris 的关系用 “80% mind-meld” 来形容。Boris 擅长的是方向感,他会说三个月后、六个月后产品应该长什么样,那个最 AGI pilled 的版本是什么。Cat 的角色则是把这个愿景翻译成执行路径:从现在到那个愿景之间,每一步怎么走?同时她花更多时间在跨职能协调上,确保市场、销售、财务、容量等团队都认同计划,不会在功能准备好之后才发现有障碍。

剩下的 20%,是各自特别在意的事情。Cat 会主导自己更关心的事,Boris 也一样,谁更在意谁就推。这种模糊分工在外面看起来不太正统,但 Cat 觉得正是因为模糊,才能快。

编者注: Boris Cherny 是 Anthropic Claude Code 技术负责人,也是 O'Reilly 出版的《Programming TypeScript》一书的作者。他在 2024 年 9 月加入 Anthropic 后构建了 Claude Code 的第一个终端原型。AGI pilled 源自互联网俚语 red pilled(出自电影《黑客帝国》),指对 AGI 即将到来持极其乐观甚至狂热的态度。在 AI 行业内部,这个词既有正面含义(敢于为更强的模型设计产品),也有警告意味(可能脱离当下模型的实际能力)。

2. 面试几百个 PM 后的发现:大多数人还活在旧世界

旧世界 PM 与 AI 原生 PM 的对比图

Lenny 提到一个有趣的现象:想去 Anthropic 当 PM 的人多到他快收到三十亿美元 ARR 的“介绍费”了。Cat 面试了几百人,她觉得大多数人对 AI PM 角色的理解方向不对

问题出在哪?Cat 认为 AI 出现之前,技术变化很慢,你可以做 6-12 个月的规划。代码写起来很贵,所以 PM 的核心工作是协调各团队的路线图,确保大家的功能互相解锁。这套打法在旧世界是对的。

但现在,模型能力在快速提升,AI 大幅加速了工程效率,很多产品功能的交付时间从 6 个月变成了 1 个月,有时候 1 周,甚至 1 天。在这个节奏下,PM 不应该把精力花在多季度路线图的跨团队对齐上,而应该想:怎么找到最快的方式把东西推出去?怎么让工程师有个想法、周末就能送到用户手里?

最好的 AI 产品 PM,能缩短从“有这个想法”到“产品到了用户手里”的时间,并且能定义出产品必须在哪些任务上开箱即用。
(“The PMs who do the best on AI native products are the ones who can figure out: How can I shorten the time from having this idea to actually getting the product in the hands of users.”)

3. 怎么做到一天出一个功能

一天发布一个功能的流水线信息图

Lenny 追问具体怎么做到这么快。Cat 讲了三件事。

第一件是设定清晰目标。 因为大语言模型能力太通用,用户是谁、解决什么问题、核心场景是什么,全都模糊。好的 PM 能把这些定死:我们的核心用户是企业里的专业开发者,这个功能要解决权限提示太多导致的疲劳感,目标是让企业开发者安全地做到零权限提示。这个目标一旦清楚,就排除掉了大量不相关的方案。

第二件是 research preview 机制。 Claude Code 几乎所有功能都先以研究预览的形式发布。明确告诉用户:这是早期产品、只是一个想法、我们在收集反馈、这个功能可能不会永远支持。这降低了发布门槛,一两周就能把东西推出去。

第三件是搭建跨职能的快速反应流水线。 Cat 的团队有一个叫 “evergreen launch room” 的机制。工程师觉得功能准备好了、内部也试用过了,就把它发到这个频道里。负责文档的 Sarah、负责产品市场营销的 Alex、开发者关系的同事会直接跳进来,第二天就能完成对外宣传。这套流程跑顺了之后,任何工程师想发布功能都没有摩擦。

Cat 说得很明确:搭建这套发布流水线,就是 PM 该干的事。

编者注: Anthropic 的发布节奏有多快?有人做过一个日历,发现 Anthropic 在 2026 年前几个月几乎每天都有一个重要功能或产品发布。

4. PRD 没死,但活法不同了

PRD 新活法的信息图

Lenny 问 PRD 还写不写。Cat 说他们做了两件替代的事。

第一是每周做严格的 metrics readout,整个团队一起看数据,确保每个人都深度理解业务的各个面、关键目标、趋势和驱动因素。

第二是维护一份 team principles,包括谁是核心用户、为什么是他们、愿意做什么取舍。这份原则的目的是让团队每个人都能自己做决策,不需要等 PM 或其他利益相关方来拍板。

PRD 并没有完全消失。对于特别模糊的功能,Cat 还是会写一页纸,列出目标、理想场景、当前失败模式。需要大量基础设施投入的长期项目也仍然有 PRD。但大部分功能不需要。

5. 不是 Mythos 让他们变快的

Mythos 与组织速度来源的对比图

Lenny 注意到 Anthropic 还没正式发布的 Mythos 模型引发了外界的关注,问他们内部是不是在用这个模型来加速开发。

Cat 的回答很直接:他们已经快了好几个季度了,Mythos 不是核心原因。 Mythos 很强大,他们确实在内部使用模型,这多少加速了开发,但不足以解释速度提升的主要部分。更大的原因是流程和团队的期望设定:每个人都觉得自己有权力也有责任把想法在一周内变成现实。

编者注: Mythos(内部代号 Capybara)是 Anthropic 的最新前沿模型,2026 年 4 月 7 日以研究预览形式限量发布,主要用于 Project Glasswing 网络安全项目。最初在 3 月 26 日因 CMS 配置错误提前曝光,Fortune 等媒体拿到的草稿描述它是一款比 Opus 更大、更强的模型。Anthropic 称该模型在代码、推理和网络安全方面能力大幅超越此前所有模型,已发现数千个零日漏洞。

6. 源代码泄露:定性为流程失败

Claude Code 源码泄露流程失败图

2026 年 3 月底,Claude Code 的完整源代码通过 npm 包泄露。Lenny 问 Cat 发生了什么。

Cat 说他们第一时间就去查了。原因是人为错误,有人在用 Claude 写一个关于包发布流程更新的 PR,这个 PR 经过了两层人工审查,但还是漏了。他们已经加固了流程,确保不会再发生。

Lenny 追问了一个尖锐的问题:这个人还在 Anthropic 吗?Cat 的回答很干脆:还在。这是流程失败,最重要的是学习教训、加强防护。

编者注: 泄露的根本原因是 Claude Code 使用 Bun 运行时构建,Bun 默认生成 source map 文件,而 .npmignore 中缺少 *.map 条目,导致一个 59.8 MB 的 source map 文件被发布到公共 npm 注册表,暴露了约 2,000 个文件、512,000 行 TypeScript 源代码、44 个未公开的功能标志,以及一个名为 KAIROS 的自主后台 Agent(从泄露的代码中发现的未发布功能,能让 Claude 在后台持续运行,甚至在用户空闲时做“记忆整理”)。这已经是 13 个月内的第二次代码泄露,而且发生在 Mythos 模型信息因 CMS 错配泄露后仅 5 天。对于一家以“安全优先”为品牌定位的公司来说,一周内两次泄露引发了外界对其运营安全的质疑。

7. 封堵 OpenClaw:容量管理还是生态围墙?

OpenClaw 容量管理与生态围墙张力图

Lenny 问到了另一个争议话题:Anthropic 禁止订阅用户通过第三方工具(特别是 OpenClaw)使用 Claude。开源社区反应很大。

Cat 的解释是:Claude 的需求量很大,他们一直在努力扩展基础设施,同时也在优化 harness 的 token 效率。订阅计划不是为第三方产品的使用模式设计的,这类产品给系统带来了不成比例的压力。他们花了很多时间想最平滑的过渡方案,最终决定给每个用户随订阅附赠一些额度,但核心决策是优先保障自有产品和 API。

我们确实需要做出一个艰难的决定,优先保障我们的第一方产品和 API。
(“We did have to make the hard decision that we needed to prioritize our first-party products and our API.”)

编者注: Cat 的回答只覆盖了这个争议的一个面。完整的时间线是这样的:OpenClaw(原名 Clawdbot,2026 年 1 月因 Anthropic 担心商标混淆改名)是奥地利开发者 Peter Steinberger 创建的开源 AI Agent 框架,在 2026 年初迅速走红,GitHub 累计 24.7 万颗星,是开源史上增长最快的项目之一。2 月 14 日,Steinberger 宣布加入 OpenAI,OpenClaw 移交开源基金会。2 月 20 日,Anthropic 更新条款明确禁止订阅 OAuth token 用于第三方工具。3 月底 Anthropic 自己的 Cowork 上线了 Claude Dispatch 等功能,和 OpenClaw 最受欢迎的能力高度重合。4 月 4 日正式封堵生效,给用户的通知不到 24 小时。Steinberger 批评 Anthropic“先复制热门功能到自己的封闭 harness 里,再把开源锁在门外”。Boris Cherny 则在 X 上表示团队“是开源的大粉丝”,他本人还给 OpenClaw 提交过改善提示缓存效率的 PR。这些举动和实际政策之间的温度差,用户感受得到。一个 $200/月的 Max 订阅用户如果通过 OpenClaw 跑全天自主 Agent,可能消耗相当于 $1,000-$5,000 的 API 成本,从经济角度看 Anthropic 的决定有合理性。但这个决定的时间节点和 Cowork 功能扩展的巧合,仍然是社区争议的核心。

8. PM 团队的全貌

Anthropic PM 团队分布地图

Cat 说 Anthropic 大约有 30-40 名 PM,分布在几个团队:

  • 研究 PM 团队:负责收集客户对模型的反馈并推动模型发布
  • Claude 开发者平台团队:维护 API 和 Managed Agents 等服务
  • Claude Code 团队:做核心产品
  • 企业团队:负责安全控制、成本管控、RBAC(基于角色的访问控制)等让大企业安心使用的功能
  • 增长团队:负责整个产品套件的增长

9. 角色融合:工程师、PM、设计师的界限在消失

工程师 PM 设计师角色融合维恩图

Lenny 问了那个所有 PM 都在焦虑的问题:PM 未来还需要吗?

Cat 的观察是所有角色都在融合。PM 在写代码,工程师在做产品决策,设计师在做 PM 的活也在提交代码。她说有两条路可以走:要么大量招有产品品味的工程师,要么维持工程师数量不变、多招 PM 来引导。Anthropic 选的是前者——大量招有产品品味的工程师。

她说团队里很多工程师完全能独立完成从“在 Twitter 上看到用户反馈”到“周末发布功能”的全流程,几乎不需要 PM 参与。这是最高效的模式。

当代码变得越来越便宜,真正变得更有价值的是决定写什么。 (“As code becomes much cheaper to write, the thing that becomes more valuable is deciding what to write.”)

Cat 自己就是工程师出身。她之前在 Scale AI 做产品工程师,在 Dagster Labs 做工程经理,然后去了 Index Ventures 做风投。团队里几乎所有 PM 要么曾经是工程师,要么在 Claude Code 上直接写代码。设计师也都做过前端工程师。

那工程背景为什么在当下特别有用?Cat 解释说,如果你有工程背景,你能判断一件事应该有多难。如果很简单,别讨论了,花一小时做掉;如果很难,你提前知道成本,就能更准确地排优先级。

不过她还是认为,不管什么背景,最核心的能力是 product taste(产品品味)

Product taste 仍然是一种非常稀缺的技能,任何能强有力地展示这种能力的人,我们基本都会录用。
(“Product taste is still a very rare skill to have, and we'll pretty much hire anyone who we feel has demonstrated this strongly.”)

10. “恰好正确程度的 AGI 信仰”

恰好正确的 AGI 信仰仪表图

谈到 PM 需要什么新技能,Cat 给出了全场最有洞察力的回答。

最难的技能是定义产品一个月后应该长什么样。这里面的模糊性很大:模型的能力在那个时间范围内会变成什么样?用户行为又会如何改变?

做到恰好正确程度的 AGI 信仰非常难。
(“It is very hard to be the right amount of AGI pilled.”)

Cat 说,每个人都能看到那个终极未来:模型极其聪明,什么都能做,你只需要一个输入框告诉它你想要什么,它自己就能接入任何工具完成任务。这就是 AGI 的产品形态。

但问题是,为那个终极版本做产品太容易了。难的是搞清楚当前模型的能力边界在哪,怎么在这个边界内榨出最大价值。 太 AGI pilled 会让你忽略眼前用户的痛点,太保守又会在下一次模型升级时措手不及。

最好的 PM 能看到一种信号:用户如何突破现有产品的极限。他们能从这些信号里判断方向,稳步推进,同时在模型能力超出或低于预期时灵活调整路线。

Cat 自己的做法是把 30% 的时间花在故意把 Cowork 推到极限,和模型对话,搞清楚它为什么在某些任务上犯错。

11. 模型暂时还不懂的东西

模型暂时不懂的人际隐性地图

Lenny 问:在模型变得超级聪明之前,人脑在哪些地方还有用?

Cat 的回答指向常识和情商。任何一次产品发布都有一千个细碎环节,模型还不能很好地判断谁是关键的利益相关方、他们之间的关系、他们的偏好、应该用什么沟通场合让他们保持在状态里。这种隐性的人际判断仍然是人的领地。她相信模型会越来越擅长这些,但目前缺口还在。

12. P0 到 P0000:混乱中怎么保持理智

P0 到 P0000 的优先级混乱图

Lenny 问如何在这种节奏下保持理智。Cat 笑着说他们的团队都是享受混乱的人。面对每一个挑战都带着笑容,因为如果你对任何事情太紧张,就会燃尽。

她给了一个很有画面感的描述:周日晚上出了一个 P0(最高优先级事故),周一又来一个 P0,周一下午来了个 P0000,“你会想,天啊,我居然还为周日那个 P0 担心过。”

她的应对方式很实际:承认你能做的事有限,睡好觉才能第二天做好决策,暴力排优先级,允许产品不够完美。有些发布确实不够打磨,但只要不影响核心场景,就接受它,等反馈,下个版本修。

13. 速度的代价:功能重叠,用户困惑

速度带来的功能重叠与用户困惑图

Lenny 问为了速度牺牲了什么。Cat 说最大的代价是产品一致性

传统做法是仔细规划产品套件里每个产品的关系、每个产品的场景、它们怎么整合。现在 Anthropic 有时候会同时推出功能重叠的东西,因为内部有两种方案都不错,他们想让外部用户来告诉他们哪个更好。

代价是新用户可能不知道完成某件事的最佳路径是什么。她承认需要做更多教育工作来帮用户理解核心功能和最佳实践。

14. Anthropic 为什么能赢:使命和聚焦

使命和聚焦如何加速组织决策的信息图

Cat 说了两个因素。

第一是统一使命。 Anthropic 招的是最在意“把安全 AGI 带给全人类”的人,这个使命在产品决策中被频繁引用。因为使命高于任何单个产品线,跨组织决策可以非常快,执行可以高度统一。

Cat 特别强调了使命的具体含义:它意味着团队愿意做出牺牲自身目标和 KR 的决策,来服务 Anthropic 整体的目标和 KR,而且人们很乐意做这种取舍。

使命意味着团队愿意做出伤害自己目标和 KR 的牺牲,来服务 Anthropic 的整体目标和 KR。
(“Mission means that teams are willing to make sacrifices that hurt their own goals and their own KRs in service of Anthropic's goals and Anthropic's KRs.”)

15. Claude Code、Desktop、Cowork:什么时候用哪个

Claude Code Desktop Web Mobile Cowork 产品入口地图

这部分 Cat 给了一个清晰的分类。

  • CLI(命令行版):最强大的,功能通常最先在这里上线。适合随手启动一个编程任务,需要最新最全功能的时候用。
  • Desktop 版:适合做前端开发。Cat 经常打开预览窗格,一边和 Claude 聊天一边实时看自己在构建的 Web 应用。
  • Web 和移动端:适合不在电脑前的时候。走在路上有个想法,掏出手机就能启动任务。
  • Cowork:处理非代码输出——回完 Slack 消息、做一个客户会议的 slide deck、写一份功能目标文档。

Cat 特别提到,要让 Cowork 发挥最大作用,第一步是连接所有相关数据源:Google Calendar、Slack、Gmail、Google Drive。只有 Cowork 能访问到足够的上下文,它才能给出高质量的输出。

16. 自定义应用:每个人的个人 SaaS

每个人的个人 SaaS 自动化流程图

Cat 讲了一个例子。Claude Code 销售团队里有个人,发现自己反复做同样类型的演示文稿。他用 Claude Code 做了一个 web 应用,内置了效果好的 deck 模板,可以从 Salesforce 和 Gong 拉取客户数据,自动生成针对特定客户的定制 deck,比如会标注这个客户是用 Bedrock 还是 Claude Code for Enterprise,对应不同的功能集。

17. Token 花费在涨,但仍低于薪资

Token 成本上涨但仍低于薪资的图表

Lenny 提到一个热门话题:token 花费超过员工薪资。Cat 确认了趋势但没给具体数字。她说每次模型升级或产品大幅改进后,人们会把更多任务交给 AI,花更多时间在 Claude Code 和 Cowork 里,单个工程师或知识工作者的 token 成本确实在增长。但目前仍然远低于工程师薪资,只是占比在持续上升。

18. Claude 的性格是护城河

Claude 性格护城河特质卡

Cat 说 Claude 的一个核心差异化是性格。用户经常提到 Claude 让人觉得“轻松有趣但又极其能干”。

她特别提到两个性格特点:

  • 低 ego:你告诉 Claude 它做错了,它会说“哎呀,谢谢你告诉我,我来修”,而不是辩解。
  • 积极正面:当你面对一个看起来无从下手的任务,Claude 会说“没关系,我觉得我们可以这样开始,要我先帮你动手吗?”

Cat 把这比作同事关系。回想你合作过的所有人,总有一些人让你觉得他们的能量特别好。Claude 的目标就是做那种同事。

19. 产品愿景:从单任务到 Agent 矩阵

从单任务到 Agent 矩阵的路线图

Cat 用 “building blocks” 来描述长期路线。核心构建单元是单个任务的成功率:你给一个清晰的 prompt,它能不能持续产出可接受的输出?

随着模型变强,单任务成功率上升,用户自然开始做多任务并行。2025 年底 multi-coding 成了大趋势,现在更加普遍。

Cat 的推演是:一个任务成功了,然后六个任务同时做。再往后,也许同时跑 50 个 Claude,或者上百个。这条路线从单兵作战走向 Agent 矩阵。

20. 闪电轮:攀岩、Waymo、和一万块巨石的退休生活

Cat Wu 兴趣偏好信号图

Cat 推荐了两本书:

  • 《How Asia Works》:讲的是什么样的政策和政府能造就持久成功的经济体。
  • 《The Technology Trap》:讲的是过去几次技术革命(工业革命、计算机革命)对工人的影响。

两本都和她正在经历的 AI 变革直接相关。

最喜欢的产品是 Waymo,每天坐两次通勤。最喜欢的影视是 F1 纪录片《Drive to Survive》和攀岩纪录片《Free Solo》。Cat 说她喜欢看人极度专注于一个纯粹的工程目标,这个偏好多少解释了她为什么会在 Anthropic。

如果有一天不用工作了?她说可能会搬到法国枫丹白露,那里有一万块巨石,每天攀岩。还想把阅读量从现在的每周 0.5 本提到一两本。

Q&A 速览

Q&A 速览便签信息图

  • Anthropic 的 PM 团队有多大? 大约 30-40 人,分研究、开发者平台、Claude Code、企业和增长五个团队。
  • PM 还需要写 PRD 吗? 大部分功能不需要。每周 metrics readout 和 team principles 替代了常规 PRD。特别模糊或需要大量基础设施投入的项目仍然有一页纸的 PRD。
  • Anthropic 用 Mythos 模型加速内部开发了吗? 有帮助但不是核心原因。速度更多来自流程和团队文化。
  • Claude Code 源代码泄露后相关人员被开除了吗? 没有。Cat 定性为流程失败,已加固防护措施。
  • 什么时候用 Claude Code 什么时候用 Cowork? 需要代码输出用 Claude Code,需要非代码输出(文档、deck、邮件处理)用 Cowork。

编辑手记:三个值得关注的矛盾

编辑手记的三个矛盾张力图

这期访谈整体是一次相当友好的对话,Lenny 没有在敏感话题上深追,Cat 也把控得很好。但几个有意思的矛盾值得关注。

第一个是速度文化和安全承诺之间的缝隙。 Cat 用了大量篇幅讲“一天出一个功能”“降低发布承诺”“让工程师自主发布”的速度文化,但 Anthropic 同时是那家把“安全”写在公司名片上的 AI 实验室。一周内两次信息外泄(Mythos CMS 错配 + Claude Code 源码 source map),Cat 的解释都是“人为失误,已加防护”。这两次失误的性质已经超出了单个 PR 的范围。对速度文化本身是否加剧了这类风险,她没有任何反思。

第二个是开放生态和围墙花园之间的取舍。 Cat 对 OpenClaw 的解释在经济逻辑上成立,一个 $200/月的订阅用户通过 Agent 框架可能消耗价值数千美元的算力。但时间线上的巧合很难忽略:Anthropic 在自己的 Cowork 产品推出了类似功能之后,才封堵了第三方工具的订阅通道。OpenClaw 创始人 Peter Steinberger 的批评“先复制热门功能到封闭的 harness 里,再把开源锁在门外”,Cat 在访谈中没有正面回应。Boris Cherny 一边说“我们是开源的大粉丝”一边给 OpenClaw 提交过改善性能的 PR,这些举动和实际政策之间的温度差,也许比政策本身更值得玩味。

第三个矛盾藏在 Cat 关于 PM 角色的论述里。 她用“角色融合”来描述 PM 的未来,但她自己给出的最高效模式是工程师端到端完成从用户反馈到发布的全流程,“几乎不需要 PM 参与”。如果这是真的,那 PM 的价值到底在哪?Cat 的答案是 product taste,但这个概念在整场对话中始终停留在抽象层面,没有给出任何可操作的定义或评估标准。当一个筛选标准无法被明确描述时,它很容易变成一个不可证伪的门槛。而她关于 AGI pilled 的论述暗含一个更深的悖论:如果模型足够强,一个文本框就够了,那她所做的产品工作本质上是过渡性的。一个产品负责人承认自己的工作有保质期,这种坦率不常见。

接下来值得观察的信号:Anthropic 承诺的安全防护措施是否真正起效,OpenClaw 封堵后开发者生态的走向,以及这套“永久 beta”的 research preview 模式能持续多久,用户的忍耐度有没有上限。

原始视频:https://www.youtube.com/watch?v=PplmzlgE0kg