大部分 AI 创业公司的未来不乐观 [译]

大部分 AI 创业公司的未来不乐观

重要性并不直接等同于盈利能力和市场竞争力

JAMES WANG

周末打造的项目,别人也能复制

先从最简单的情况谈起。

我见过不少初创公司,他们只是简单地整合几个生成式 AI API,做点提示工程,然后加个前端界面。有些产品做得挺精致,功能也不错。

但这些公司大多走不远,要么就是普通公司(并非 Paul Graham 定义下的典型初创公司),要么就消失了。

显然,如果你能在一个周末搭建出这样的项目,别人也能。假设你编码能力超群,是位杰出的程序员奇才!其他人或许需要花几个周末……但最终还是会有人做出类似的东西。

如果你的项目只是免费分享,仅为娱乐,那问题不大。

但如果你开始收费,客户越来越依赖你的产品,就会有竞争者以更低的价格进入市场。即使你的产品更优秀,产品优势通常能吸引用户选择,但如果产品真的很重要(即市场支付意愿高,使用频繁),经济学和竞争的无情法则就会出现。别人会模仿你,抢走你的利润。

没有独特性和差异化就意味着没有利润。这是经济学的基本原理。

即便是 Alphabet、Meta 或 OpenAI 也缺乏稳固的市场防线

这是基础的经济学和创业学。这种情况并不是这个领域独有的。每一个热门话题的炒作周期都是因为人们暂时忘记了这些基本规则,最终在周期结束时痛苦地重新意识到这一点。

但请注意,我主要讨论的是那些仅仅把像 ChatGPT 这样的 API 集成进用户界面的初创公司。这些公司很显然几乎没有什么区别性和市场防御力。哪怕你的用户界面做得再好,其他人也能轻松模仿。

我的观点不仅限于这些浅显的例子。

现在,我们用同样的逻辑来分析 ChatGPT、Bard、LlaMA 等大语言模型(大语言模型)的底层技术。

如果我告诉你,我发明了一项伟大的技术,人人都会想要使用,要创造它,我做了以下事情:

  1. 收集互联网上所有的文本

  2. 投入大量 GPU 和数百万美元进行训练

  3. 使用大多数是开源的众所周知技术构建

这算得上是有防御力的吗?对于小型初创公司而言,第 1 点和第 2 点可能会有技术或物流上的难度,但这对其他大公司来说并非难以克服——尤其是考虑到第 3 点。所有这些技术都是基于变压器(Transformer)和大语言模型的同一底层架构。这些大语言模型实际上并没有真正的市场壁垒。任何一个大型互联网公司都有能力复制它们。

事实上,就连 Alphabet/Google 内部也有类似的看法

对于所有图像和视频生成式 AI(生成式 AI)也是一样的。只是把第 1 点换成图像或视频(旁注:如果 Alphabet 能限制对 YouTube 的访问,视频可能会成为一个例外)。

那么,如果我拥有人工智能的最佳“版本”会怎样呢?

好,我们已经弄清楚了,仅仅为别人的技术搭建一个 API 是不太有效的(我们的简单案例)。现在我们还讨论了为什么在 LLM(大语言模型)这种更复杂的情况下,根本无法保持防御。

那如果我着重强调上面提到的第三点,开发出了 LLM 的“最佳版本”,或者在人工智能的其他领域也有类似的创新呢?

理论上,这听起来很吸引人。但问题是,整个行业的技术前沿发展速度太快。

这就像在 90 年代拥有最快的 CPU

想象一下,如果我在 90 年代告诉你我拥有“最好的”CPU,它的速度是英特尔的三倍!

考虑到开发 CPU 的高成本和难度,这确实是一个技术壮举!但问题是,你能每年都保持这样的领先吗?因为当时半导体技术(遵循摩尔定律)发展迅速,你的优势可能只持续一两年。英特尔和其他公司很快就会追上你。除非你有持续领先的独特方法,否则你可能只是偶然发现了一些优化技术,其他人很快也会采用。

如今的人工智能领域也面临同样的问题。技术前沿发展迅速,整个 AI 学术界和产业研究社区的实力几乎肯定超过了你的公司。

顺便说一句,即使在规模最大的情况下,这个挑战也同样存在。比如,根据一些非正式的传闻,中国在 AI 发展速度上并没有跟上全球(尤其是美国)的研究社区。几乎所有独立发展专有模型的人都很快落后,并最终不得不采纳全球最先进的技术。AI 领域比半导体更具挑战性,因为它大多是开源的,这使得保持任何长期的算法优势变得更加困难。

因此,除非你能利用那一两年的优势真正构建一个持久的竞争壁垒,否则你不会获得持久的价值——而这,实际上是非常困难的。

那么,什么才是真正可持续的呢?

经过这样的筛选过程,那么到底什么才是我们可以持续依靠的呢?

巨量计算:仿佛哥斯拉级别的规模

你可以尝试从事那些计算要求极高的任务,以至于只有你能够以经济上可行的方式进行训练或推理。但在我看来,这种情况不太可能发生,特别是考虑到 AI 在减少实现特定成果所需的数据量和计算量方面取得的进步。不过,我的这种看法并不太受欢迎。你可以自己判断这一点是否正确(我在上述链接的文章中有所讨论)。不过,至少从一个投资者的视角来看,即便这确实是一个优势,我对于初创公司积累比谷歌、Facebook、百度等更多的 GPU/ASIC/FPGA 的策略并不太感兴趣...

现实世界的专有数据

另一方面,你也可能处于一个不能简单地从互联网上获取数据的领域。例如,医疗数据往往被隔离在医院中,或者甚至至今都没有被收集。还有,诸如蛋白质折叠或药物动力学反应数据等,需要通过现实世界的实验来艰难收集的数据。还有很多其他例子……它们都有一个共同点,那就是这些数据并不存在于纯粹的数字世界中,也不能简单地从互联网上爬取。

正是我认为大多数 AI 初创公司创造价值的地方。在这些领域,简单地决定去收集数据是不现实的,因为成本高昂、耗时且面临实体世界的复杂性。这些初创公司可以顺应 AI 技术的进步——这并不重要,因为算法本身已经成为商品——但它们却是唯一拥有并掌握那些几乎不可能获取的现实世界数据的公司。

创造的价值并不总能被公司捕获

注意,这里我提到了初创公司。许多人常忘记,虽然在社会层面上能创造价值,但这并不意味着公司就能从中获益。比如,20 世纪 90 年代的互联网热潮建立了大量网络基础设施,但投资于此的公司却遭受了巨大的负投资回报率(ROI)。虽然这对社区的在线接入大有裨益,但这毕竟是社会效益,而非公司的 ROI。

近期的一个例子是,你知道 Azure 实际上运行了众多私有区块链吗?由于多种原因,这些在财务报告上很难体现,但很多大公司都在 Azure 上运行这些区块链系统,让 Microsoft 成为了区块链领域的大赢家。(当然,私有区块链是否真与数据库有异,这是另一个话题,但与我的主题无关。)

类似的情况也可能出现在 OpenAI 上,OpenAI 似乎更像是 Microsoft 的研发实验室。Microsoft 在 Azure 中提供计算资源,作为回报,OpenAI 开发了 Azure 将来会提供的托管服务工具。Azure 随后可以通过 ChatGPT 和其他按需付费的 API 调用来赚取巨额收益。当然,这种情况也与 Bard 和 Google Cloud Compute 等类似,随着时间推移这会越来越明显。

这一原则适用于当今大多数 AI 领域。将会有大量的价值产生,但这些价值只会归于社会,而非任何私人实体。这实际上是件好事——这是技术成为社会和宏观经济中少有的“免费午餐”之一的方式。

同时,还有很多价值将被现有行业的巨头所独占,他们利用市场影响力和规模优势。虽然这对社会来说并非无偿馈赠,但这也是资本主义的运作方式,通常仍能为社会创造“剩余价值”(经济学术语,意为“好事物”)。

最后,只有一小部分价值既被创造又能被新兴、年轻的公司所获取,理想情况下,这些公司最终能取代现有巨头(这是市场健康更替的表现)。

这些 将会产生巨大回报并成为未来知名科技公司的企业——这正是风险资本家们理论上追求的目标。然而,现实中,许多投资者在向 AI 初创企业(包括那些自称拥有“AI 策略”的大型上市公司)投资时显得过于随意。因此,他们很多时候实际上只是在白白浪费金钱。

AI 肯定会改变世界,但绝大多数 AI 初创公司却可能无法成功。