AI 创业者需要学习《苦涩的教训》:第二章 - 无护城河 [译]
摘要(tl;dr)
在大多数垂直领域中,横向 AI 产品最终会胜过垂直 AI 产品。垂直 AI 虽先入市场,但谁能在长期中取胜?
切换成本将会很低。横向 AI 将类似一位远程同事,其入职流程就像给新员工配备预装软件和权限。
垂直 AI 在其他方面也难以建立护城河。在赫默(Helmer)的七大“力量”中毫无优势。
……除非真有可能出现“独占资源”(cornered resource)——同时满足“绝对独家”且“为该垂直领域所必需”这两个条件的资源。这种情况非常罕见。多数人以为自己拥有通过专有数据形成的护城河,但往往误解了要求:要么并非真正独家,要么并非真正必需。
AI 历史给我们的启示非常明确:那些试图用领域知识来弥补模型局限性的解决方案,最终都会输给利用更多算力、更加通用的方案。在第一章中,我们已经看到这一模式再度浮现:许多公司在构建的垂直 AI 产品实际上在限制模型的灵活度,而非拥抱能随着每次模型迭代而改进的更通用解决方案。不过,光有更好的性能并不足以赢得市场。本章将从 Hamilton Helmer 的“7 Powers”理论框架出发,探讨垂直产品与横向产品的市场采用情况。我们将看到,那些构建成“垂直化工作流程”的产品,一旦横向替代方案变得可行,便难以维持市场地位。然而,也有一个至关重要的例外,暗示了在 AI 应用层领域创业时,一条清晰的产品策略。
正如第一章所示,使用更强大、更少限制的模型的产品,最终会在性能上胜出。然而,基于现有模型(通过工程手段引入人为偏见来减少错误)的解决方案,却往往能率先上市。需要澄清的是,这篇文章讨论的是图 1 中标注的“绿色区域”——假设我们已经进入这个阶段,横向 AI 代理的性能在未来将优于当前的垂直 AI,那么垂直 AI 能否维持其市场份额?
图 1:随时间推移,垂直 AI 产品与横向 AI 产品的性能对比曲线,展示了三个阶段:传统软件主导阶段、垂直 AI 进入市场阶段,以及随着模型改进,横向 AI 取得进展的阶段。
当然,图 1 只是简化了的模型。具体的曲线会因问题难度而异。许多 AI 潜在能解决的问题本身就非常困难,以至于垂直 AI 永远无法达到可接受的性能水平(如图 2 所示)。对绝大多数这种问题而言,目前没有任何创业公司会去尝试,所以尽管它们占据了潜在 AI 应用的大部分,但在当下的 AI 赛道中只占少数。
图 2:与图 1 相对比,这里展示的是更难的问题场景,垂直 AI 产品从未能达到足够的性能水平,而随着模型改进,横向 AI 在这一场景中则能获得远优于垂直 AI 的效果。
针对那些足够“简单”,能够被当前相对受限的方案解决的问题(如图 1),关键的问题就变成了:当更优的解决方案到来时,垂直 AI 是否还能保持领先?
要想描绘这片战场:垂直 AI 很容易识别,因为这是当下大部分 AI 应用层创业公司所构建的产品。第一章已详细讨论了定义,简而言之:它们通过在预先定义的工作流程中对 AI 进行各种限制,从而获得更高的可靠性。与之相对,横向 AI 会像一位远程同事。想象一下 ChatGPT,但它可以在后台对电脑执行操作,使用传统(非 AI)的软件来完成任务。它的“入职”流程就跟招聘一位新员工一样:给它一台装有标准软件和账户权限的电脑,然后用自然语言与之沟通指令。你无需提前把所有可能的数据源都提供给它,因为它可以自行导航并找到所需数据。另外,我们假设这种横向 AI 会由某家 AI 实验室(如 OpenAI、Anthropic 等)来构建,至于为何,这将在第四章中进一步讨论。
值得注意的是,这里我用了带有人格化的语言来描述“横向代理”,但它不需要像人类一样聪明才能完成绝大多数任务。这并不是所谓的“ASI(人工超级智能)”。不过,它足够聪明到可以在找不到可用工具时,自己编写软件以实现特定交互。我认为在相对短的时间尺度上,这样的场景值得期待,因为代码编写恰恰是目前 AI 模型进步最迅速的领域之一。
当然,关于“这件事是否真的会发生,以及何时发生”(见第三章)的讨论仍然存在。但我见过不少创始人,他们一方面坚信这一切会发生,另一方面却依旧觉得他们的垂直 AI 能在这场竞争中生存下来。
我自己就曾亲身体验过被这种竞争打败的经历。2022 年 11 月,OpenAI 上线了 ChatGPT,我想用它来解读科学论文。然而,当时它无法处理长文本(因为长输入需要更多计算资源,OpenAI 出于成本考虑进行了限制)。GPT-3.5 API 上线后,我做了一个叫做 AcademicGPT 的垂直 AI 产品,借助多次 API 调用拆分输入来解决长文本限制。这个产品有付费用户,但当 GPT-4 上线后支持更长的输入,之前所有我通过工程手段加的人为限制就瞬间过时了。相比经过精心工程改造、有偏见的垂直解决方案,GPT-4 这个“更通用、更少偏见”的方案一下子提供了更好的结果。
我并不是唯一的例子。YC 合伙人 Jared 在 Lightcone 的播客里提到:“第一波基于 LLM 的应用大多数都被下一代 GPT 所‘冲垮’了。”当然,那些“第一波”产品比当今的垂直 AI 产品更为简单,只是为某个痛点做了一层非常薄的封装。AcademicGPT 只解决了一个问题——输入长度。但今天的垂直 AI 创业公司会为多个问题提供更复杂的工程手段。或许这能延长它们的生命周期,但当大模型一个接一个地在能力上迎头赶上,曾经辛苦构建的限制和修正逐渐会被大模型直接内置,正如 GPT-4 扩展上下文窗口后,我先前对输入长度的定制“补丁”就不再有意义。正如第一章所说,随着模型变得更强,最终它们将面临一种各方面都优胜的横向解决方案的竞争。
我们可以用 Hamilton Helmer 的“7 Powers”作为一个分析框架,看看垂直 AI 产品能否抵挡住这种竞争。“7 Powers”理论列举了七种可持续的竞争优势来源:规模经济(Scale Economies)、网络效应(Network Economies)、反向定位(Counter-Positioning)、切换成本(Switching Costs)、品牌(Branding)、独占资源(Cornered Resource)以及流程优势(Process Power)。
切换成本(Switching Cost)
指的是由于更换服务提供商时可能遭遇的损失或障碍,而使客户更倾向于留在现有平台。
整合/用户体验(Integration/UX)
用户可能已经习惯了垂直 AI 产品的界面,但当横向 AI 的“入职”流程非常简单时,这就难以构成真正障碍。毕竟企业给新员工配置系统和权限已经是常态。正如 Leopold Aschenbrenner所言,这种“远程同事”式的解决方案只需“丢进去”就能自动化那些能够远程完成的工作。
此外,这种横向 AI 很可能是从现有的 AI 产品进化而来(比如你已经使用或熟悉的 ChatGPT),用户体验也就相当自然。再加上横向 AI 产品能够在不同任务间无缝共享上下文,这更是垂直 AI 产品所不具备的优势。
人类自然语言对话似乎是最好的 UI,因为它几乎是我们大部分日常交互的首选形式。不过,有些场景下计算机 UI 会更便捷。例如我们仍能使用 Excel 等传统软件来与横向代理协作。当然,我也不排除可能存在某些场景,传统软件或自然语言都不够理想,这时若有新的 UI 形态能配合 AI,就可能产生切换成本的壁垒。然而,这种壁垒不在于 AI 本身,而在于 UI 及配套流程;非 AI 版本(供横向 AI 使用)同样能发挥作用。
销售(Sales)
如果横向产品是由你原本就已经拥有的产品进化而来,那么销售上的门槛也不复存在。许多企业已经完成了对 ChatGPT 的采购或审批流程,而这一趋势只会持续扩大。
定价(Price)
目前最接近我们设想的“横向 AI 远程同事”的产品也许是 Claude 类似的“计算机使用模式”,由于需要频繁调用大型语言模型并处理高分辨率图像等,成本居高不下。垂直 AI 公司通常会尽力缩小输入范围,从而降低费用。但模型推理的成本一直在快速下降,AI 实验室之间的竞争也会加速这一进程。再者,用一个横向 AI 覆盖多个垂直领域,也比同时授权多个垂直 AI 更经济。
反向定位(Counter-Positioning)
一种新的商业模式,令已有玩家难以复制或适应,从而形成独特的竞争地位。
乍一看,垂直产品似乎能通过对客户的贴合定制形成某种“反向定位”的优势。但这只有在确实能比对手做得更好时才成立,而在我们设想的场景中(见第一章),垂直 AI 并没有性能优势。
反过来看,横向方案的优势更像是“反向定位”:每次模型改进,横向方案都可轻松利用,而垂直产品则会陷入两难:要么坚持原有限制,性能被甩开,要么跟进新模型,放弃原先差异化。
规模经济(Scale Economy)
随着业务规模的增长,单位生产成本逐渐下降,让企业更具成本效益。
规模经济对于垂直和横向产品都是可用的。垂直 AI 可以像传统 SaaS 一样依靠规模摊薄成本,而横向 AI 同样可以,而且还能通过在多领域共用的模型研发成本,更快地压低价格。
网络效应(Network Economy)
随着用户数量增加,每个用户都能从更大的用户群中受益,从而形成自强化增长循环。
对于网络效应,结论也类似于规模经济:垂直和横向产品都能通过用户数据进行改进。然而,横向方案天然具备更大的数据优势——它能收集到来自更多领域的多样化数据,进而提升通用模型的性能。这种更广泛的反馈回路会进一步增强横向产品在所有用例上的表现。
品牌力(Brand Power)
基于公司历史业绩和声誉形成的、难以替代的价值感。这会带来用户忠诚度并允许溢价。
对于大多数还在初创阶段的 AI 公司而言,品牌力很难形成(见图 3)。也许 OpenAI 或谷歌能够做到,但针对垂直领域的初创公司很难通过品牌建立护城河。
流程优势(Process Power)
需要长期打磨才能建立,且竞争对手需要付出极大努力才能追赶的组织能力。通常是复杂的内部系统或流程,能带来卓越的运营效率。
同样地,对于仍处于早期阶段的公司来说,流程优势还很遥远(见图 3)。
图 3:业务成长的三个阶段,以及最常在各阶段出现的“力量”类型。
独占资源(Cornered Resource)
指的是在有利条件下对稀缺或价值资产的独家占有或独家使用权,例如专利、独家数据等。
到目前为止,我们还没发现任何力量能帮助垂直 AI 在与横向 AI 的竞争中取得优势。真正能打破这个规律的,就只剩“独占资源”了。但这种资源极为罕见。它必须同时满足“确实独家”(在任何价位都无法购买得到)和“确实必需”(没有它,任何其他要素都不足以弥补)这两个条件。很少有垂直领域能具备这样的资源。我相信不少做垂直 AI 的团队觉得自己拥有一些专有数据,进而形成了护城河,但他们往往误解了要求:要么数据不是真正独家,要么数据不是那种“没有就万万不行”的必需品。不过,确实会有少数垂直领域能够获得这样的资源。举个例子,如果他们在一次极为罕见的事件中采集到并掌握了关键数据,那么只要他们保持对这些数据的控制权,再强大的横向模型也无计可施。
综上所述,当一个率先上市的垂直 AI 产品面对性能更优的“横向 AI 远程同事”时,几乎所有垂直解决方案都无法找到有效的防御壁垒。通过分析 Helmer 的 7 Powers,我们看到“独占资源”或许是垂直 AI 唯一可能的护城河。这意味着,在 AI 应用层创业时,与其花大力气在模型工程上,不如考虑如何获取并掌握这样的独家资源(第四章会对此展开讨论)。否则,一旦横向产品变得有竞争力,无法建立壁垒的垂直 AI 终将被取代。AcademicGPT 是一个典型的例子:它当时只解决了横向方案无法处理的“长文本”问题,但当 GPT-4 增加了上下文长度,这个小众优势也就瞬间消失。对于那些同时解决多个痛点的更复杂垂直 AI 公司,结局可能只会来得稍晚一些而已。
然而,这里有一个“房间里的大象”:上述分析的前提是我们认为“远程同事”式的横向 AI 会很快到来。第三章将围绕这一前提展开探讨,我们会做出一些具体预测,并深入探究从现在到那个未来可能遇到的障碍,包括模型发展停滞、监管壁垒、信任问题以及经济压力等。