管理:AI 时代的超能力

作者:

Ethan Mollick

管理:AI 时代的超能力

在智能体的世界里乘风破浪

前不久,我在宾夕法尼亚大学开了一门实验课,挑战学生在四天内从零开始创建一家初创公司。班上学员多为高管 MBA (EMBA),他们既要上课,同时也身兼医生、经理或大中小企业的领袖之职。没几个人写过代码。

我带他们使用了 Claude Code 和 Google Antigravity,这是构建原型必不可少的工具。但这毕竟只是原型,算不上初创公司。于是,他们又利用 ChatGPT、Claude 和 Gemini 来加速创意生成、市场调研、竞争定位、路演推介以及财务建模等流程。我很好奇,在如此短的时间内,他们能走多远。

结果,进展惊人。

演示案例包括:

我教授创业已十五载,阅过成千上万个创业点子(其中不乏后来成长为巨头的案例),所以我很清楚这类聪明的 MBA 班级能产出怎样的成果。据我估算,他们在短短几天内的完成度,比 AI 出现之前学生花整整一个学期做出来的,高出了整整一个数量级。大多数原型不再只是几张示例图,核心功能真的跑通了。点子也比以往更加多样、有趣,市场和客户分析更是洞见深刻。

这着实令人印象深刻。虽然这些还不是正式运营的初创公司,产品也没完全成熟(个别除外),但他们省去了传统流程中数月的耗时和巨额的投入。还有一点至关重要:大多数早期初创公司都需要转型(Pivot),即随着对市场需求和技术可行性的了解加深而调整方向。AI 降低了转型的成本,让探索各种可能性变得轻而易举,你不再被单一路径锁死,甚至可以同时探索多个创业方向——你只需要告诉 AI 你想要什么。

我很想说这些成果归功于我的英明教导,但事实上,我们还没有一套完美的框架来指导如何使用这些工具,学生们主要靠自己摸索。好在他们具备一定的管理经验和学科专长,因为事实证明,成功的关键恰恰在于上一段提到的那一点:告诉 AI 你想要什么

随着 AI 处理任务的能力日益增强(原本需要人类数小时的工作现在唾手可得),评估这些结果也变得越来越耗时,委派 (Delegation) 能力的重要性随之飙升。但问题来了:到底什么时候该放手让 AI 去做?

智能体工作的计算公式

答案其实有,但略显复杂。考量因素有三:

首先,由于 AI 能力的锯齿状前沿 (Jagged Frontier),你无法确切预知 AI 在复杂任务上的表现是好是坏。其次,不管 AI 做得好坏,它肯定很快。人类耗时数小时的工作,它几分钟就能搞定。第三,它很便宜(相对专业薪资而言);哪怕生成多个版本后弃用大半,它也毫无怨言。

基于这三个因素,决定是否委派给 AI 取决于三个变量:

  1. 人类基准时间 (Human Baseline Time): 你亲自完成这项任务的时长。
  2. 成功概率 (Probability of Success): AI 在单次尝试中产出达标结果的可能性。
  3. AI 处理时间 (AI Process Time): 你提出请求、等待结果并评估 AI 产出所需的时间。

不妨建立一个思维模型:这本质上是一场博弈——是用"人类基准时间“亲自操刀,还是支付”AI 处理时间"作为管理成本?后者可能需要反复迭代,方能通过验收。

成功概率越高,你需要支付的 AI 处理时间 就越少,把工作交给 AI 就越划算。举个例子,某项任务你自己做要一小时,AI 分分钟搞定,但检查它的答案需要半小时。这种情况下,只有当 成功概率 很高时,交给 AI 才划算,否则生成和检查草稿的时间反而比自己做还多。但如果 人类基准时间 是 10 小时,哪怕 AI 需要你花几个小时去交互和修正,只要它能胜任,这笔买卖就做得过。

这一公式的有效性,已由去年夏天 OpenAI 发布的一篇关于 AI 与实际工作的重要论文——GDPval 所证实我之前讨论过这篇论文,重点在于它让金融、医学、政府等不同领域的资深人类专家与最新的 AI 同台竞技,并由另一组专家担任裁判。

专家完成工作平均需要 7 小时,这就是 人类基准时间AI 处理时间 则很有意思:AI 完成任务只需几分钟,但专家实际检查工作需要一小时,当然,写提示词也需要时间。至于 成功概率,GDPval 刚发布时,裁判在多数情况下判人类胜出;但随着 GPT-5.2 的发布,天平倾斜了。GPT-5.2 Thinking 和 Pro 模型平均有 72% 的时间打平或击败人类专家。

现在我们可以算笔账:假设一项 7 小时的任务,成功率为 72%,评估耗时 1 小时。如果你尝试把每个任务都交给 AI——花时间写提示词,花一小时评估答案,如果 AI 做得烂再自己重做——你平均能节省 3 小时。虽然 AI 搞砸的任务会让你多花时间(浪费了提示和审查的时间!),但 AI 成功的任务会让你效率倍增。

更有意思的是,我们可以利用管理技巧,让这个公式对我们更利!

学会委派:新时代的提示工程

要在委派 AI 时更划算(提高“成功概率”,降低“AI 处理时间”),我们可从三方面入手:

  1. 给出更优指令:设定清晰目标,让 AI 执行时更容易成功。
  2. 提升评估与反馈能力:以更少的尝试次数引导 AI 做对。
  3. 简化评估流程:想办法更轻松地判断优劣,减少时间成本。

所有这些都依赖于学科专长 (Subject Matter Expertise)——专家知道该下达什么指令,能敏锐地发现问题,也更擅长修正错误。

若无特定要求,当下的 AI 模型在自主解决问题方面已强得离谱。比如,我发现 Claude Code 仅凭一个提示词就能生成一款完整的 80 年代风格冒险游戏:“创建一个完全原创的老派 Sierra 风格冒险游戏,EGA 风格画面。用你的图像智能体生成图片,并给我一个解析器。确保所有谜题有趣且可解。完成游戏(游玩时长 10-15 分钟),不要问任何问题。做得精彩有趣点。”

就这么简单,AI 包办了一切,包括美术。再用两条提示词测试并部署,你现在就能玩到了:enchanted-lighthouse-game.netlify.app

这确实令人惊叹,但这种惊叹很大程度上是因为我没有什么具体要求,AI 可以自由发挥。然而,实际工作和真正的委派意味着你心中有特定的产出目标,这时候事情就变得棘手了。你如何将意图传达给 AI,让它既能运用“判断力”解决问题,又能精准交付你想要的结果?

这一难题早于 AI 存在已久,普遍到各行各业都衍生出了特定的文书体系来应对。软件开发者写 产品需求文档 (PRD);电影导演分发 分镜表;建筑师制作 设计意向书;海军陆战队使用 五段式命令(情况、任务、执行、行政、指挥);咨询顾问用详细的 交付规格说明书 来界定项目范围。

这些文档在新的智能体 (AI Agent) 工作流中,都能作为极佳的 AI 提示词(而且 AI 可以一次性处理长达数页的指令)。这些格式之所以通用,是因为本质一致:试图将一个人脑中的想法转化为另一个人的行动。

仔细观察那些优秀的委派文档,你会发现内容惊人地一致:

  • 我们要达成什么目标,为什么?
  • 授权的边界在哪里?
  • 什么样的结果才算“完成”?
  • 我需要哪些具体的产出?
  • 我需要哪些阶段性产出来跟进进度?
  • 你在告诉我“做完了”之前,应该先检查什么?

如果这些规范得当,AI 和人类一样,更有可能交出漂亮的答卷。

在琢磨如何给 AI 下指令的过程中,你会发现:你其实是在重新发明管理学。

管理智能体

在大牌 AI 实验室里,一些最知名的软件开发者指出,他们的工作正从以编程为主转变为以管理 AI 智能体为主。这很有趣。编程向来结构严谨,产出极易验证(代码要么能跑,要么报错),因此它成了 AI 工具最早成熟的领域之一,也成了最早感受到这种转变的职业。但这绝不是最后一个。

作为商学院教授,我认为许多人已经具备(或可以学习)与 AI 智能体共事所需的技能——那就是 管理学基础 (Management 101)。如果你能讲清楚需求,给出有效反馈,并设计出评估工作的方法,你就能驾驭智能体。在很多方面,至少在你擅长的领域里,这比设计精巧的提示词更容易,因为它更像是与人共事。

与此同时,传统管理学总是建立在“稀缺”的假设之上:你需要委派,是因为你自己做不完,而且人才有限且昂贵。AI 改变了这个公式。现在,“人才”充裕且廉价。真正稀缺的,是知晓该要求什么。

这就是为什么我的学生能表现得如此出色。他们不是 AI 专家,但他们花了数年时间学习如何在各自的专业领域界定问题、定义交付成果,并能识别出财务模型或医疗报告哪里不对劲。他们拥有从课堂和工作中千锤百炼得来的思维框架,而这些框架变成了他们的提示词。那些常被轻视的“软技能”,如今反而成了最硬核的能力

当每个人都成为管理者,指挥着一支不知疲倦的智能体大军时,工作具体会变成什么样,我尚不可知。但我猜,那些能脱颖而出的人,将是那些知道“好”是什么样子,并能清晰表达到连 AI 都能听懂的人。

我的学生在四天内悟出了这个道理。不是因为他们是 AI 原住民,而是因为他们早已懂得如何管理。原来,所有的那些训练,都在无意间为这一刻做好了准备。


关于此文的讨论

Drew [2 天前]

好文章,但你的建议有两点感觉还停留在 2025 年。

  1. 委派文档可以和 AI 一起写,而非独自撰写。 例如,Claude Code 有个工具叫 AskUserQuestionTool,它会通过多选题采访你,直到帮你建立好委派文档。
  2. “评估和审查”最初也应由 AI 操刀,因为现在的算力不值钱。 你可以把任务和评估标准都写进提示词,Claude Code 可以同时扮演两个角色,自我博弈,直到工作成果通过它自己创建的内部测试。当计算成本为零时,AI 的迭代也是免费的。

让人类在 AI 之外做这两步既无必要,也不高效。

这正是 Sutton 所谓的 《苦涩的教训》 (The Bitter Lesson)。别太自作聪明,多用算力。

是的,这是一种思维转变。这就好比你在一个水电匮乏的第三世界国家长大,然后搬到了美国,拥有无限的清洁水和电力。你需要一段时间才能改掉节约的习惯。

知识工作精力 (KWE) 也是如此。我们在 KWE 稀缺的世界长大,现在它变得丰富了,我们却还在试图节约。这需要一些“去学习化”的过程!

建议教教你的 MBA 学生:别再试图省力了。

Dov Jacobson [2 天前]

你假设管理者知道自己想要什么。

我们以为我们知道。

但我发现,委派和评估的过程,恰恰是挑战和完善我最初计划的宝贵机会。无论是对人还是对 AI 智能体,解释我的想法往往能激发我重新思考,而评估结果总是能带来新的启发。

你的模型把迭代委派仅仅视为一种低效,却忽略了它作为战略精进的价值。