OpenAI 的 Deep Research 会让我失业吗?
——对 Sam Altman 推文的一次调查
数以百万计的人面临失业,居然只用一条推文就随意宣布了……但这就是我们当下所处的时代。上周,Sam Altman 发了条推文,根据他“非常粗略的感觉”,OpenAI 的新产品 Deep Research 可能“能够完成世界上单位数百分比的所有经济价值任务”。如果你把每个任务都看作一个工作岗位,并假设“单位数”代表 5%,那么 Altman 指的就是在上周的发布会上一口气替代美国 820 万名工人的工作。
如果他的判断正确,我们很快就会看到大规模裁员和对从事研究相关工作的求职者的大幅减少。作为一个生计直接受这款产品威胁的人,我觉得他的说法很值得好好推敲一下。
Deep Research 会根据你提出的问题,在互联网上搜集答案,并以研究报告的形式反馈给你。它是最早的 AI Agent 产品之一,且同时具备以下两点特质:1)大体上可用;2)能被 ChatGPT 那数以亿计的用户直接购买使用。也正因如此,有关 AI 对就业影响的讨论已不再是停留在理论层面,而变得更加紧迫。
AI 的宏大承诺在于它会自动化现有的绝大部分知识型工作。这听起来很酷,但也让人联想到“面包排队大军”的情景!我个人对“知识型工作”的定义是:任何需要用到键盘的任务——而这几乎涵盖了我们大部分的工作。要弄清我们是否会见证“单位数百分比的经济价值任务”被颠覆,我们首先需要尝试回答以下问题:
以往是否有其他技术造成过类似程度的冲击?
Deep Research 是否有潜力对知识型工作造成这样的影响?
这篇文章那位极其英俊的作者是否应该准备回家种地?
让我们一探究竟。
技术究竟是什么?
对于“是否有其他技术曾像 Altman 所说的那样取代劳动力”这个问题,简短的答案是否定的。但更长的答案或许是肯定的。容我解释。
当我们谈论“技术”时,通常指的是某种将科学知识运用到人类活动中的方式,要么让人类能够做之前无法做的事,要么让原本的事情更轻松一些。更为基础性的技术(比如电力)则往往成为众多技术应用的底层支柱。以电力为例,在合适的发明家手里,电力可用于洗衣机,从而为忙碌的父母自动化了大部分洗衣任务。
这里的关键点在于:具体应用会“颠覆”任务,而基础技术则会“重塑”经济。
1780 年代到 1890 年代英国棉纺行业的例子或许最能说明问题。最初,该行业高度依赖具有高超技能的手工织布工,这些工人对将棉花转化为纺织品至关重要。随着机械织布机在这一时期的普及,这些工人慢慢消失在历史中。
从某种角度来看,这是一个关于技术力量的故事。最初,棉纺行业在 1780 年代只占到英国 GDP 的约 1%,到了 1813 年增长到 7–8%。棉花进口量与此相呼应,从每年 2600 万磅飙升到了 1831–1835 年的 3 亿磅。尽管规模迅速扩张,棉纺织工的实际工资在 1800 年代早期达到顶峰,随后到 1830 年时跌到原来的四分之一(见上述链接)。

上图选自 Acemoglu and Johnson, 2024。
有趣的是,即使工资暴跌,在 1820–1830 年间,棉纺织工的总数并没有减少多少。

这是因为随着机械织布机的普及,纺织工作逐渐变成了一种低技能工作——使用机械织布机所需的训练大大减少,几乎所有人都能上手。所以一直到 1830 年代,当工资触及最低点之后,相关劳动力才开始明显减少。但直到 1860 年代的一次经济衰退(由美国内战引发)之后,手动织布工作才真正彻底消失。
在长达一个世纪的时间里,棉纺行业 利润极其丰厚,但几乎所有利润都流向了工厂主。想要转去其他行业的入门工作并不容易——在农业里,土地供应日趋紧张,这一传统的低技能就业途径也被切断了。织布工几乎无路可走。
我们很容易简单地说自动化对劳动力是好是坏,实际上要更微妙得多。技术的发展可能会降低成本并提高经济产出,但劳动力能否从中分得好处——甚至能否逃离原本职业被摧毁的命运——往往还取决于一系列超越技术本身的政治和社会经济因素。
所以说,很少有技术能在一夜之间彻底替代劳动力,但从长远看,它们会迫使劳动力要么转到别的岗位,要么接受薪酬下行的压力。
而当一种能完成“经济价值任务”的技术出现时,往往意味着以下几种情形之一:
它催生了新的任务(比如计算机让我们学会编程);
它自动化了现有的一类工作(洗碗机让我们不必再手洗餐具);
它让现有工作更具生产力(铁锤让我们更快地搭建房屋)。
基于这个框架,下一个关键问题自然是:Deep Research 究竟能做什么?它被应用在什么样的场景中?
AI 正在到来
Deep Research 使用一个 AI Agent 来制定计划、搜索网络并回答用户的问题。在 Every 的内部测试 中,我们发现这个工具相当好用,但并非完美。如果你是某个领域的专家,你仍会遇到各种频繁且微妙的事实遗漏或失真。不过通过 精心提示(prompt)某种程度上能弥补这些缺陷。我的粗略判断是,它的研究水准大约相当于一个优秀的研究实习生,或者工作经验不到六个月的初级分析师。你得知道它可能会出错的地方,但它能让你快速、高效地获得某个问题 80% 的深度调研成果。
举个例子,我用它来帮我找上一节中合适的例子。看看下图,你能不能发现错误?

作者截图
它把开始的时间弄错了。机械化其实更早就出现,而手工织布工也没有在这个时间段就销声匿迹。此外,“hand-weaving” 这种说法其实并不准确,最好的说法应该是 “handloom weaving”。
但对喜欢钻研的人来说,这就像毒品一样让人上瘾。我花了好几个小时阅读它生成的研究报告,提出各种我一直好奇但又懒得去翻学术文献的问题。这个产品用起来非常上瘾,而且在广泛的知识领域都能发挥作用。
它目前的价格是每月 200 美元(比请一个免费实习生更贵,但比给一个受过良好训练的分析师的报酬便宜),如果你的工作经常要看研究报告,这钱大概率花得值。再过五年,我想它会解决那些大部分细微的错误。到那时候,任何想找入门级分析师工作的人,找工作(或至少拿到能维持生活的薪水)都会更加艰难。而今天支撑互联网运转的很多模式——诸如依靠免费公开信息来吸引用户并投放广告——也有可能受到冲击。
归根结底,如果要认同 Altman 的观点,你就必须相信实习生级别的研究工作在全世界“经济价值任务”中占了“单位数百分比”。我并不是这样认为。我只是心血来潮,让 Deep Research 估计一下“Deep Research 能替代的美国 GDP 及劳动力百分比”是多少(我就随便选了美国)。它的回答是:“目前只有不到 5% 的完整工作岗位(即职业)可以被完全自动化。”你可以自行解读这句话。
不过,这款产品才刚刚发布,如果 AI 推理模型的提升速度保持下去,感觉在三年内 Deep Research 就有可能达到我现在写作水平(即便我自己这三年也会有所成长)。
还有一点让我对 Deep Research(乃至整个 AI)感到不安:历史上大多数自动化劳动力的技术,例如汽车、硅晶体管,都需要在实体层面部署——你需要把机器运送到工厂里才能用。而对 AI 来说,每增加一个用户,对服务商而言的边际成本都相对较小,而且分发成本几乎为零。ChatGPT 只不过是浏览器中的一个新标签页而已。Deep Research 在 2 月初发布时,一下子就有 12.5 万名 ChatGPT Pro 订阅者即时获得了使用权。对此我们既没有经济学模型,也缺乏历史先例可借鉴。
职业冲击
在我大部分职业生涯中,我一直引以为傲的是自己的能力:能严谨思考问题,能独立寻找数据来源,并能通过各种材料说服他人按照我的思路去行动。但 OpenAI 现在发布了一系列可以增强(或者替代?)上述能力的产品:ChatGPT 用于思考,Deep Research 用于寻找数据,Canvas 用于基于这些数据来做报告。我过去赖以“与众不同”的那些技能,如今却变成了 200 美元/月就能买到的服务。
这并不是什么令人愉快的领悟。
这不代表“写作者”这个职业会消失,但它意味着在作家传统工作范畴中承担的各种任务,正受到这些技术带来的价格下行压力。那些曾让我在市场上显得与众不同的特质,现在却成了一种可以买到的商品。我们这家名为 Every 的公司一直鼓励多才多艺的人——能写代码、写文章、做创作、烘焙、作曲、设计等等。我们的组织结构也为这种多元能力的融合提供了支持。即便如此,随着这些模型一个月一个月地进步,如果我仍然维持目前“首席写作者”的职责不变,我的合同就会越来越显得“性价比不足”。
或许你会说,我与生俱来的审美或“品味”在 Deep Research 时代会变得更有价值(也许我可以拿这个论点跟老板谈加薪?)。当 Deep Research 生成了那张表格时,我的直觉立即告诉我哪里不对;我只需要几分钟就能看出问题所在。对刚起步的写作者来说,如果他们没有多年摸索财务模型、练就 Google 搜索技巧的积累,就未必能轻易培养这样的直觉。老实说,我自己都不太确定这个论点是否成立,但这是我唯一能安慰自己——以及安慰看到这里的你的方式。
我不知道 Altman 的话到底对不对。他给出的数字对我来说有点偏高。但 AI 推理模型的进步速度的确快得吓人。我们离只需要极少数人来完成需要深入研究的工作,似乎已经并不遥远。