全速前行:2024 年的机器学习、人工智能与数据(MAD)领域展望 [译]
这是我们第十次发布关于数据、分析、机器学习和人工智能生态的年度综述。
覆盖这个领域十多年来,现在的局势比以往任何时候都更加令人兴奋和充满前景。多年来我们跟踪的所有主流趋势和细分领域正汇聚在一起:大量数据已被数字化;通过现代化工具,我们可以快速且经济地存储、处理和分析这些数据;更重要的是,这些数据现在能够供给性能更强的 ML/AI 模型使用,这些模型能够理解数据、识别模式、基于数据进行预测,甚至现在能够创造文本、代码、图像、声音和视频。
MAD(机器学习、人工智能与数据)生态系统已经从一个小众技术领域发展成为主流。似乎这种范式的转变正在加速,其影响已经超出了技术和商业领域,波及到社会、地缘政治,乃至影响人类生存的方方面面。
然而,在这个持续数十年的大趋势中,我们仍有很多内容需要探索和编写。正如往年一样,本文试图对当前的产品、公司和行业趋势进行梳理和解读。
以下是过去几年的版本链接:2012,2014,2016,2017,2018,2019(第一部分 和 第二部分),2020,2021 和 2023(第一部分,第二部分,第三部分,第四部分)。
今年,我们的团队成员包括 Aman Kabeer 和 Katie Mills(来自 FirstMark),Jonathan Grana(来自 Go Fractional)以及 Paolo Campos。在此对他们表示衷心的感谢。同样,我们也要感谢 CB Insights 提供了交互版本中展示的数据卡片。
我们的年度报告分为三大部分:
- 第一部分:行业概览(PDF 版和交互式版本)
- 第二部分:我们在 2024 年关注的 24 个主题
- 第三部分:融资、并购与 IPO 情况
第一部分:行业概览
链接
想要全面了解 2024 年市场动态图谱的 PDF 版本(建议放大查看),请点击这里。
查阅 2024 年市场动态图谱的交互式版本,请点击这里。
公司标识数量
2024 年的市场动态图谱展示了总共 2,011 个公司标识。
相比去年的 1,416 个,新加入了 578 家企业。
作为参考,2012 年的首个版本仅展示了 139 个公司标识。
这一密集(甚至可以说是疯狂的)行业概览,主要归因于连续发生的两轮大规模的企业创立和资金注入。
第一波持续了大约十年的浪潮是数据基础设施建设周期,它起始于大数据的概念,终结于现代数据处理技术的兴起。这一领域长久以来期盼的整合并未如预期那样发生,而是大部分公司仍旧活跃在市场上。
第二波则是机器学习与人工智能的发展周期,这一周期的开端标志着生成式 AI 技术的真正应用。由于我们正处于这一周期的初始阶段,许多公司仍然处于创业早期,因此我们在景观图中包括了很多尚处于种子阶段的年轻初创公司。
值得一提的是:这两个发展浪潮紧密相连。MAD 景观图每年的目标之一就是揭示数据基础设施(左侧)、分析/商业智能与机器学习/人工智能(中间)以及应用程序(右侧)之间的相互促进关系。
尽管每年将越来越多的公司纳入景观图变得愈发困难,但最终,将 MAD 领域视为一条完整的数据处理生产线——从数据收集、存储、处理到最终通过分析或应用程序实现价值创造,可能是最为恰当的比喻。
两大浪潮 + 有限的市场整合 = 景观中的众多企业。
在“基础设施”和“分析”领域的主要更新
我们几乎没有修改景观图左侧部分的整体架构——如我们将看到的,关于现代数据技术是否已过时的讨论(现代数据栈是否已死?),这一部分的热度有所下降。
一些显著的更新包括:我们将“数据库抽象”更名为**“多模型数据库与抽象技术”,以此来涵盖围绕全面性‘多模型’数据库群(如 SurrealDB*, EdgeDB)的新兴趋势;去除了去年尝试性加入、但显得格格不入的“加密/ Web 3 分析”部分;同时,我们还移除了“查询引擎”**部分,因为它更像是部分的一环,而非独立的一节(该部分包含的所有公司——如 Dremio、Starburst、PrestoDB 等——仍在景观图上展示)。
在“机器学习与人工智能”领域的主要更新
伴随 2023 年人工智能公司数量的激增,这一部分我们进行了迄今最大幅度的结构调整。
过去一年里,AI 赋能领域的活动非常活跃,我们在 MLOps 旁增设了三个新领域:
- “AI 可观测性” 今年首次出现,专门针对那些帮助测试、评价及监控大语言模型应用的创业公司
- “AI 开发者平台” 虽然与 MLOps 概念相近,但我们想特别表彰那些全心投入于 AI 应用开发的平台,尤其是在大语言模型的训练、部署和推理方面
- “AI 安全与安保” 涵盖了应对大语言模型所固有的各种问题的公司,包括产生错误信息、伦理问题、遵守法规等
Sam Altman 与 Elon Musk 之间的公开冲突让我们意识到,在基础模型开发领域,区分商业和非盈利机构至关重要。基于这点,我们将原本的“横向 AI/通用人工智能”一分为二,分别是 “商业 AI 研究” 和 “非盈利 AI 研究”。
我们进行的另一个调整是在命名上,将“GPU 云”更新为 “GPU 云 / ML 基础设施”,以反映出许多 GPU 云提供商添加的核心基础设施功能。
“应用”中的主要更新
最引人注目的变化是,毫不奇怪,现在每个应用层公司都自称是“AI 公司”。这一点,虽然我们尽力过滤,仍旧导致了你在 MAD 图谱右侧看到的新标识数量急剧增加。
在结构上的一些细微调整包括:
- 在“横向应用”中,我们新增了 “演示与设计” 类别
- 我们把“搜索”更名为 “搜索 / 对话式 AI”,以反映出如 Perplexity 这样的基于大语言模型的聊天界面的兴起。
- 在“行业”类别中,我们把“政府与情报”更名为 “航空航天、防务与政府”
“开源基础设施”中的更新
我们整合了之前非常接近的分类,创设了一个全新的 “数据管理” 类别,涵盖了“数据访问”和“数据操作”。
我们还引入了一个重要的新类别:“本地 AI”。这是因为开发者们正寻求提供必要的基础设施工具,将 AI 和大语言模型引入到本地开发的新时代。
第二部分:我们在 2024 年关注的 24 个主题
AI 领域的发展速度之快,关注度之高,使得我们几乎无法像往年那样提供一个全面的 MAD 空间“国情咨文”。
现在,让我们换一个角度来探讨:这里列出了 24 个当前备受关注或在讨论中经常提到的主题。它们既包含了一些较为成熟的想法,也有很多仅仅是问题探讨或思维实验。
- 结构化与非结构化数据
这既是一个被频繁讨论的主题,也是我们用来解释当前趋势时常提及的一个点。
作为 2024 年讨论的开场,这里先给出一个关键提醒,它涉及一些核心的行业趋势:数据并不是千篇一律的。简单来说,数据大致可以分为两大类,每类数据都形成了自己的一套工具和应用场景。
- 结构化数据处理流程:指的是可以被整齐地放入行和列中的数据。
- 分析目的的数据会从事务性数据库和 SaaS 工具中提取,存储到像 Snowflake 这样的云数据仓库,之后进行转换,并通过商业智能(BI)工具进行分析和可视化,主要用于理解现状和历史(所谓的“描述性分析”)。这一过程通常依托于下文将讨论的现代数据技术栈,并以分析为核心应用场景。
- 另外,结构化数据也可以供“传统”的机器学习/AI 模型使用,以预测未来事件,比如哪些客户最可能取消服务。
- 非结构化数据处理流程:涉及到通常不适合放入行和列的数据,如文本、图像、音频和视频。非结构化数据主要用于训练和运行生成式 AI 模型(如大语言模型等)。
这两类数据及其相关的工具和公司正面临着截然不同的发展态势和关注度。
目前,非结构化数据(机器学习/AI)领域正热,而结构化数据(现代数据技术栈等)领域则相对冷清。
- 现代数据技术栈是否已经过时?
就在不久之前(大约在 2019 到 2021 年间),在软件界,几乎没有什么比现代数据技术栈(MDS)更引人注目的了。它和“大数据”一起,成为了极少数能够从数据工程师扩展到更广泛受众(如高管、记者、金融家)的基础设施概念之一。
现代数据技术栈主要涵盖了之前提到的那种结构化数据处理流程。它以快速发展的云数据仓库为中心,囊括了上游的供应商(如 Fivetran 和 Airbyte)、核心层的(DBT)以及下游的(Looker, Mode)。
随着 Snowflake 创下史上最大的软件首次公开募股 (IPO) 纪录,现代数据栈 (MDS) 瞬间成为热点。受零利率政策 (ZIRP) 刺激的公司创立和风险资本 (VC) 投资活动变得异常活跃。不久,数据目录、数据可观察性、数据提取转换加载 (ETL)、反向 ETL 等领域迅速饱和。
现代数据栈不仅提供了真实问题的有效解决方案,它还代表了一种营销策略和实际上的各创业公司之间的联盟,共同服务于数据处理的不同阶段。
但转眼至今,形势已截然不同。我们在 2023 年预告了 MDS 正面临压力,而这种压力在 2024 年将更加显著。
MDS 正遭遇两大挑战:
- 搭建现代数据栈意味着需要整合多个独立供应商提供的各种顶尖解决方案。这不仅花费巨大,还耗时耗力,这在后零利率政策时代的预算削减中并不受财务主管的欢迎。
- 如今,MDS 已不再是最受瞩目的焦点。所有的关注都转向了生成式 AI,无论是企业高管、风险资本家还是媒体,都对需要上述提到的非结构化数据管道的生成式 AI 产生了浓厚兴趣。
推荐收听:MAD Podcast,特邀嘉宾 dbt Labs 的 CEO Tristan Handy,探讨现代数据栈的未来(可在 YouTube、Apple Podcasts 或 Spotify 收听)。
- 数据基础设施的整合及巨头的进一步壮大
面对以上状况,2024 年数据基础设施和分析领域的走向可能是这样的:
- 在现代数据技术的领域内外,许多初创公司正积极转型,将自身定位为“AI 基础设施初创公司”,并力求在现代 AI 技术架构中占据一席之地(详见下文)。虽然这在某些案例中取得了成功,但大多数情况下,从处理结构化数据转向非结构化数据的转变,意味着产品需要经历根本性的进化。
- 数据基础架构领域终于将迎来一些整合。到目前为止,合并与收购(M&A)活动相对较少,但在 2023 年,确实发生了一些并购案例,无论是小规模还是中等规模的并购——例如 Stemma 被 Teradata 收购、Manta 被 IBM 收购、Mode 被 Thoughtspot 收购等(详见下文第三部分)。
- 由于风险资本的支持日渐减少,更多初创公司将面临失败的命运——这是个艰难的现实。尽管许多初创公司已经大幅削减开支,但终有一天,他们的资金将耗尽。虽然不会有引人注目的标题报道,但这是个不幸的事实。
- 在这个领域中,无论是快速成长的公司还是上市公司,都将加大力度发展自己的平台战略,努力扩展更多功能。这部分通过收购(即前述的整合)来实现,但也有很大一部分通过自身开发来完成。
- 雪花(Snowflake)与数据砖(Databricks)的最新对决
提及该领域的大公司,不妨来看看两大数据基础设施巨头——雪花(Snowflake)和数据砖(Databricks)之间的“巨大冲突”(详见我们的MAD 2021博客文章)。
雪花(传统上源自结构化数据处理领域)依旧是一家卓越的企业,是目前估值最高的上市科技股之一(撰文时,其企业价值/未来十二个月收入(EV/NTM revenue)比率为 14.8 倍)。然而,与许多软件行业一样,其增长速度已显著减缓——2024 财年,其产品收入年增长率为 38%,总计达到 26.7 亿美元,预计未来十二个月的收入增长率为 22%。更重要的是,雪花似乎在产品层面感受到了压力——在拥抱 AI 方面反应较慢,并且在收购方面也相对较少。最近那次有些突然的 CEO 变动,也是一个值得注意的现象。
Databricks,一个源于非结构化数据处理和机器学习领域的公司,正展现出全面的强劲动力。据悉(尽管它仍是一家私营企业),该公司在 2024 财年的收入达到了 16 亿美元,年增长率超过 50%。值得注意的是,通过并购(特别是以 13 亿美元收购 MosaicML)和自主产品研发,Databricks 正逐渐成为生成式 AI 领域的关键参与者。它不仅是大量非结构化数据的主要存储库,这些数据是训练大语言模型的关键,同时也在模型创新上走在前列,从 Dolly 到最新公布的生成式 AI 模型 DBRX。
Snowflake 与 Databricks 之间竞争的一个重大进展是Microsoft Fabric 的推出。2023 年 5 月宣布的这个项目,是一个端到端的云端 SaaS 数据和分析平台,整合了多个 Microsoft 产品,包括 OneLake(开放式湖仓库)、PowerBI 和 Synapse Data Science,涵盖了从数据整合、工程到数据科学的所有数据分析工作流程。尽管大公司的产品推出总会存在宣传与实际的差距,但结合 Microsoft 在生成式 AI 方面的大举推进,这无疑构成了一股不容小觑的威胁(更别提 Databricks 大部分基于 Azure 平台)。
- 2024 年的商业智能(BI)展望:生成式 AI 是否将颠覆数据分析?
在所有现代数据技术和结构化数据处理领域中,商业智能(BI)似乎是最有潜力迎来革命的领域。我们在 2019 MAD 报告中提到,BI 行业几乎已经完成整合,并在 2021 MAD 中探讨了度量存储的兴起。
不过,BI 和数据分析领域的转型进程比预期中要缓慢。目前,这个行业仍然被老牌产品,如 Microsoft 的 PowerBI、Salesforce 的 Tableau 和 Google 的 Looker 主导,这些产品有时会作为更广泛销售合同的一部分免费提供。尽管发生了一些整合(例如 Thoughtspot 收购 Mode,Sisu 被 Snowflake 秘密收购),但许多新兴公司正在尝试采取创新的方法,无论是成熟企业(如 dbt 及其语义层/MetricFlow)还是初创公司(如 Trace* 及其度量树),它们大多仍处于发展的初期阶段。
此外,生成式 AI 不仅可能在数据提取和转换中发挥重要作用,还可能在极大地增强和普及数据分析方面产生重大影响。
近期,技术界确实热闹非凡。OpenAI 推出了“代码解释器”,后改名为“高级数据分析”。微软也不甘落后,为 Excel 中的金融工作人员推出了 Copilot AI 聊天机器人。从云服务供应商到 Databricks、Snowflake、开源社区,再到众多初创公司,大家都在忙着研发或已经推出了“文本转 SQL”产品,目的是让人们能用自然语言来执行数据库查询。
这一切的发展都充满了激动人心的可能性和颠覆性的潜力。数据分析的终极目标——让更多人能轻松使用数据——似乎触手可及。如果自然语言能成为操作笔记本、数据库和 BI 工具的通用接口,那么分析工作将变得前所未有的普及。
尽管如此,许多 BI 行业的专家对此持保留态度。他们认为,SQL 的精确性和在构建查询时理解业务背景的复杂性,是自动化过程中难以克服的障碍。
- 现代 AI 技术栈的崛起
迄今为止我们的讨论主要集中在结构化数据管道上。
而非结构化数据基础设施的世界则是另一番景象。非结构化数据为大语言模型(LLMs)提供了食粮,对此的需求异常强烈。无论是正在尝试或已经部署生成式 AI 的公司,都在重新认识到一句老话的真理——“数据是新型石油”。每个人都渴望利用大语言模型的力量,并希望这些模型能基于自己企业的数据进行训练。
为了抓住这个机遇,无论大小的公司都在竞相提供生成式 AI 的基础设施。
一些 AI 快速发展的企业,如 Databricks(见上文)、Scale AI(他们将原本为自动驾驶汽车市场开发的数据标注基础设施转变为与 OpenAI 等公司合作的企业数据管道)以及 Dataiku*(他们推出了 LLM Mesh,让全球 2000 强企业能够在多个大语言模型供应商和模型间无缝工作),都在积极拓展他们的服务,以便利用市场的动力。
同时,一个涵盖多个领域的新一代 AI 基础设施初创公司正快速崛起。
- 向量数据库,这种数据库以一种向量嵌入的形式存储数据,正好适用于生成式 AI 模型。在这个领域,一些专业公司(Pinecone, Weaviate, Chroma, Qudrant 等)取得了巨大成功,而像 MongoDB 这样的数据库老牌企业也迅速跟进,引入了向量搜索功能。目前,业界还在热议是否更长的上下文窗口能够让向量数据库变得不再必需,对此有着激烈的讨论和不同的看法。
- 框架(LlamaIndex, Langchain 等),它们的作用是连接和整合各个环节,确保系统的协同工作。
- 安全防护,它们存在于大语言模型与用户之间,确保模型的输出符合组织制定的规则。
- 性能评估器,它们用来测试、分析并监控生成式 AI 模型的表现。考虑到人们普遍对公开基准的不信任,这是一项挑战性任务。
- 查询路由器,它们能够实时地把用户的查询指派给不同的模型,旨在优化性能、降低成本并改善用户体验。
- 成本监控,它们用于跟踪大语言模型使用过程中的开销。
- 接口点,本质上是将底层基础架构(如模型)的复杂性封装成了 API。
尽管我们对“现代 AI 栈”这一术语有所保留,毕竟“现代数据栈”的历史令人回味,
但这个说法确实揭示了许多相似之处:这批初创企业就像过去 MDS 公司的热门之选,他们习惯于集体行动,形成市场联盟和产品合作伙伴关系。
这波 AI 基础设施的创新者同样面临着与 MDS 公司类似的挑战:哪一类产品能够支撑起一个价值数十亿美元的企业?大型企业(主要是云服务提供商,还包括 Databricks 和 Snowflake)会选择自主开发哪些部分?
关注 - 我们在 MAD Podcast 上展示了许多崭露头角的现代 AI 栈初创企业:
-
向量数据库探索:
-
MAD Podcast 特辑:Guardrails AI 的 CEO Shreya Rajpal 讨论如何安全部署生成式 AI,确保技术的负责任使用 (Apple, Spotify)。
-
MAD Podcast 特辑:Llama Index 首席执行官 Jerry Liu 分享如何利用大语言模型解锁数据的潜力,促进信息的获取与处理 (Apple, Spotify)。
-
在 MAD Podcast 中,Sharon Zhou(Lamini 的首席执行官)讨论了如何为企业微调大语言模型(LLM)。观看 YouTube 或收听 Apple Podcasts、Spotify。
-
Dylan Fox(Assembly AI 的首席执行官)在 MAD Podcast 中分享了利用生成式 AI 进行语音识别的前沿技术。观看 YouTube 或收听 Apple Podcasts、Spotify。
- 我们目前处于人工智能炒作周期的哪个环节?
人工智能历经数十年发展,曾经历过数次的高潮和低谷。在过去的 10-12 年里,我们正处于第三轮人工智能的炒作中:第一轮发生在 2013-2015 年,那时深度学习在 ImageNet 2012 大赛后走进公众视野;第二轮在 2017-2018 年左右,伴随着聊天机器人的流行和 TensorFlow 的兴起;现在,自 2022 年 11 月以来,因生成式 AI 再次引发热潮。
这轮炒作特别剧烈,几乎达到了人工智能泡沫的地步,原因众多:技术本身极为引人注目;其影响深远,吸引了广泛受众的关注,不仅仅局限于技术圈;对于坐拥巨额资本的风险投资者而言,这成为了他们眼中的独家投资机会,尤其是在其他科技领域普遍低迷的情况下。
炒作带来了预期的种种好处(“没有狂热就没有伟大的成就”,让千百种想法竞相绽放的阶段,大量资金支持着雄心勃勃的项目)和无处不在的噪音(人人自称 AI 专家,每个创业公司都标榜为 AI 公司,AI 相关会议、播客、新闻简报层出不穷……甚至可能有过多的 AI 市场分析图)。
任何炒作周期都会面临不可避免的反弹。
这一市场阶段充满了**“古怪”和风险**:这个领域的标杆公司拥有非常特殊的法律和治理结构;出现了许多未被充分理解或公开的“以计算力换取股份”的交易;许多顶尖的创业公司由 AI 研究人员团队领导;很多风险资本交易让人回想起零利率政策(ZIRP)时期的“抢地盘”现象,对刚起步的公司给出天价估值和大额融资。
虽然人工智能炒作已经出现裂痕(详见下文),但我们仍处于几乎每周都有新创意令人惊叹的阶段。而诸如沙特阿拉伯宣布的 400 亿美元 AI 基金等消息似乎表明,涌向这一领域的资金流不会很快干涸。
- 实验与现实:2023 年是否只是场虚张声势?
关于上述内容,考虑到目前的炒作,迄今为止,究竟有多少是实质性进展,而非仅仅是试验阶段的成果?
2023 年充满了动作:a) 每个技术供应商都争先恐后地将生成式 AI 集成进他们的产品中,b) 每家全球 2000 强企业的董事会都指示其团队积极“应用 AI”,一些企业在受监管行业,如摩根士丹利和花旗银行,甚至以创纪录的速度部署了相关技术 c) 当然,消费者对生成式 AI 应用的热情空前高涨。
2023 年对于一些公司来说是充满突破的一年:OpenAI 的年营收达到了 20 亿美元;Anthropic 的快速增长让其预计 2024 年的收入可达到 8.5 亿美元;Midjourney 在零投资和只有 40 人的团队下,收入飙升至 2 亿美元;Perplexity AI 的月活跃用户数从零飙升至 1000 万等。
是否应该持怀疑态度呢?这里有一些担忧:
- 在企业市场,许多开支是用于概念性的验证或者快速获得的成果,这些通常来自于创新预算。
- 这其中有多少是因为高管们不想在快速变化的市场中显得落后,而不是真正解决业务问题?
- 在消费者市场,我们看到 AI 应用的用户流失率很高。这仅仅是因为好奇心驱动吗?
- 无论是在个人还是职业生活中,许多人都表示不太清楚如何有效利用生成式 AI 应用和产品。
- 并非所有由顶尖 AI 专家开发的生成式 AI 产品都能创造奇迹。Inflection AI 在筹集了 13 亿美元资金后迅速退出,是否意味着市场并不需要更多的 AI 聊天机器人或 LLM 提供商?
- LLM 公司:也许并非如外界所想,它们并没有那么容易被替代?
投入到基础模型公司的不仅仅是数十亿的风险投资和企业资金。
因此,过去 18 个月里大家最关心的问题是:我们是否在目睹一场对最终可能变得平凡的产品的资本大举燃烧?还是说,这些 LLM 提供者将成为新的 AWS、Azure 和 GCP?
一个让这些公司头疼的事实是,目前还没有任何 LLM 能够建立起长期的性能优势。截至目前,Claude 3 Sonnet 和 Gemini Pro 1.5 的表现优于 GPT-4,而 GPT-4 又优于 Gemini 1.0 Ultra,如此循环,但这种情况似乎每隔几周就会变化。性能也可能会有波动——ChatGPT 有时会“失去理性”或表现出“懒惰”,尽管这是暂时的。
此外,开源模型(如 Llama 3、Mistral 和 DBRX 等)在性能上正迅速追赶。
更重要的是——市场上的 LLM 提供者数量远超最初的预期。几年前,普遍认为 LLM 公司可能只有一两家,因为全球能够扩展 Transformers 的人才非常少,从而形成了赢者通吃的局面。
事实上,比最初预见的还要有更多能力强大的团队。除了 OpenAI 和 Anthropic 外,还有不少初创企业正在 AI 基础研究领域深耕不辍,如 Mistral、Cohere、Adept、AI21、Imbue、01.AI 等,当然还有 Google、Meta 等大公司的团队。
尽管如此 - 目前为止,提供大语言模型的公司表现良好。OpenAI 和 Anthropic 的收益正在以惊人的速度增长。即便大语言模型本身可能变得普及,这些大语言模型公司仍拥有巨大的商业机遇。它们已经发展成为提供全方位服务的公司,为不同的客户群体(消费者、企业、开发者)提供应用程序和工具,建立在基础模型之上。
从某种程度上讲,将它们与云服务提供商相比较颇为贴切。AWS、Azure 和 GCP 通过应用/工具层吸引并留住客户,而主要通过几乎无区别的计算/存储层实现盈利。
推荐观看:
- MAD Podcast 访谈Ori Goshen,AI21 Labs 联合创始人
- MAD Podcast 访谈Kanjun Qiu,Imbue 首席执行官
- 大语言模型、小语言模型及其混合的未来
在所有对大型语言模型的热情中,最近几个月一个明显的趋势是小型语言模型(如 Meta 的 Llama-2-13b、Mistral 的 Mistral-7b 和 Mixtral 8x7b、Microsoft 的 Phi-2 和 Orca-2)的快速发展。
尽管大语言模型的规模正变得越来越庞大(据报道 GPT-3 拥有 1750 亿个参数,GPT-4 则有 1.7 万亿个参数,世界正期待更加强大的 GPT-5),小型语言模型因其低廉的运营成本、便于微调以及通常具备的强大性能,正成为许多应用场景的有力替代品。
专门模型的兴起也是一个加速的趋势,这些模型专注于特定任务(如编程的 Code-Llama、Poolside AI)或特定行业(比如 Bloomberg 的金融模型或 Orbital Materials 等初创公司为材料科学建立的模型)。
正如我们在众多企业部署中看到的,世界正迅速向结合多种模型的混合架构演变。
虽然价格持续走低(详情见下文),但那些体量庞大的专有大语言模型仍旧代价不菲,且存在延时问题。因此,为了满足各自的特殊需求和成本考量,用户及客户正逐渐倾向于采用各种模型的混合部署方案,涵盖大型与小型、商业与开源、通用与专用。
推荐观看:MAD Podcast 与 Eiso Kant, Poolside AI 的首席技术官(CTO),的对话(Apple, Spotify)
- 传统 AI 是否已成过去式?
ChatGPT 的问世引发了一场风波:几乎所有之前的 AI 技术一夜之间都被冠以“传统 AI”的标签,形成了与“生成式 AI”的鲜明对比。
这对许多一直自认为是在做前沿探索的 AI 从业者和企业来说,无疑是一次冲击,因为“传统”二字似乎预示着新技术将完全取代旧有的 AI 形态。
然而,事实远比这更为复杂。传统 AI 和生成式 AI 实际上是相辅相成的,它们针对不同的数据类型和应用场景。
所谓的“传统 AI”,有时也被称作“预测 AI”或“表格 AI”,仍然是现代 AI(基于深度学习)的重要组成部分。它主要针对结构化数据(参见上文),处理如推荐系统、客户流失预测、价格优化、库存管理等问题。过去十年里,“传统 AI”在全球数以千计的公司中得到了广泛应用和大规模部署。
与此形成对比的是,生成式 AI 主要处理非结构化数据(如文本、图像、视频等),并在代码生成、图像生成、搜索等不同领域展现出卓越的能力。
未来的发展方向也将是一种“混合模式”:公司将根据任务的不同,既使用大语言模型,也会使用预测模型。更为重要的是,他们会经常将这些模型结合起来使用——例如,尽管大语言模型可能不擅长提供像客户流失预测这样精确的预测结果,但它可以通过调用另一专注于该预测的模型的输出来弥补这一点,反之亦然。
- 构建轻量级与重量级接口的竞争以及全栈发展的趋势
2023 年,人们常用“薄包装”这个词来轻蔑地描述那些依赖外部技术(比如 OpenAI)来实现核心功能的项目。人们认为,如果你的创新依赖于别人的技术,那么创造持久的价值和差异化就变得更加困难。近几个月的报告显示,一些如 Jasper 这样的初创企业,在快速增长其收入之后,似乎遇到了挑战,这似乎验证了这种观点。
一个引人注目的问题是,随着这些年轻企业逐渐增加自己的功能,他们是否能从简单的“薄包装”转变为功能更丰富的“厚包装”?
到了 2024 年,这些“厚包装”项目似乎找到了通过特定方式实现差异化的途径:
- 集中解决一个特定、往往是细分的问题——广泛的解决方案往往会触动大型科技公司的敏感区域
- 为这一问题构建特定的工作流程、合作模式和深度集成
- 在 AI 模型层面下大力气——无论是使用特定数据集对模型进行细致调整,还是创建专为自家业务设计的混合智能系统(比如大语言模型、SLMs 等)
换言之,他们需要在狭窄的领域内深耕,同时构建起覆盖应用到基础设施的“全栈”能力。
- 2024 年值得关注的领域包括:AI 智能体和边缘 AI
过去一年里,AI 智能体——一个能在多种场景下协助完成任务的先进系统,从帮助预订旅程到自动进行销售开发活动,再到实现企业级自动化——成为了众人瞩目的焦点。
AI 智能体是实现自动化的终极梦想,通过“文本到行动”的方式,AI 能够自动为我们完成各种任务。
尽管市场上不时出现像去年的 BabyAGI 到最近的 Devin AI(一个被称为“AI 软件工程师”的产品)这样的代理型产品,并引起极大的兴趣,但这种热情大多显示为过于急躁。在能够构建出能够协同工作、代表我们执行具体任务的复杂系统之前,还有很多基础工作需要完成,以使得生成式 AI 更加稳定和可预测。此外,还需要解决一些挑战,比如如何在 AI 系统中加入更多的“记忆”功能。不过,预计在未来一两年内,AI 智能体将成为一个特别激动人心的领域。
另一个引人注目的领域是 边缘 AI。虽然大规模运行并作为服务端点提供的大语言模型 (LLMs) 市场巨大,但 AI 领域长期追求的一个目标是能够在本地设备上运行的模型,特别是在不配备 GPUs 的普通手机和智能物联网 (IoT) 设备上。这个领域活力四射,包括 Mixtral、Ollama、Llama.cpp、Llamafile、GPT4ALL (Nomic) 等。谷歌和苹果也预计将逐渐增加参与度。
- 生成式 AI 是在向通用人工智能 (AGI) 迈进,还是走向了发展的高原期?
在所有关于 AI 的热议中,问这样一个问题几乎是不敬的 —— 但是,是否存在一个可能,即生成式 AI 的发展不是加速直至通用人工智能 (AGI),而是开始放缓?这意味着什么?
这个论点主要包含两部分:一方面,基础模型的开发本质上是一项力量的较量,我们可能会耗尽供给它们的资源(计算力和数据);另一方面,即便资源不成问题,通往通用人工智能的道路涉及到推理能力,而这是大语言模型当前所缺乏的。
有趣的是,这与 6 年前行业内的讨论大体相似,正如我们在2018 年的一篇博客文章中所述。自那以后,最大的变化似乎是我们对更加强大的模型投入了大量的数据和计算资源。
至于在 AI 推理方面我们取得了多少进展,整体上还不太明确 — 尽管 DeepMind 的 AlphaGeometry 项目看起来是个重要的里程碑,因为它将语言模型与符号引擎结合起来,利用逻辑规则进行推理。
至于我们离计算或数据资源耗尽还有多远,则很难确定。
似乎每天我们对“计算资源耗尽”的界限都在进一步推迟。NVIDIA 最近推出的 Blackwell GPU 系统,据公司称,它能够部署高达 27 万亿参数的模型(相比之下 GPT-4 为 1.7 万亿)。
在数据方面,问题较为复杂 — 不仅仅是关于耗尽合法授权数据的策略性问题(比如所有 OpenAI 的授权协议),还有关于是否会耗尽文本数据的更广泛讨论。毫无疑问,围绕合成数据的研究正在积极进行中。Yann LeCun 讨论了如何通过让模型处理更丰富的视频输入来进一步提升,这一目标目前尚未实现。
GPT-5 身上寄托着巨大的期望。人们普遍认为,它与 GPT-4 相比的表现将成为评判 AI 进步速度的关键指标。
对于创业生态圈的参与者(如创始人、投资人)来说,这个问题可能在中期内的重要性不大——即使生成式 AI 的发展在明天突然停滞不前,我们仍然可以利用现有技术在不同领域和应用场景中探索商业机会数年之久。
- GPU 战争:NVIDIA 是不是被高估了?
我们现在是否正处于一个大规模周期的初期,计算资源成为全球最宝贵的资产?或者我们是否过度扩大了 GPU 的生产,走向了一场不可避免的大崩溃?
作为生成式 AI 领域准备最充分的 GPU 生产商,NVIDIA 正享受着其辉煌时刻,股价上涨了五倍,达到 2.2 万亿美元的市值,自 2022 年末以来,其总销售额增长了三倍,其财报发布和 Jensen Huang 在 GTC 上的表现激起的热情堪比 Taylor Swift 在 2024 年最大的活动。
这是否也得益于数十亿美元的 AI 风险投资最终流向了 NVIDIA?
不过,尽管 NVIDIA 的公司实力毋庸置疑,其未来的命运将取决于当前的 AI 淘金热能否持续。硬件生产充满挑战,精确预测 TSMC 在台湾需要生产多少 GPU 是一门复杂的技术。
与此同时,从 AMD 到 Intel,再到 Samsung,竞争对手正努力迎头赶上;像 Groq 或 Cerebras 这样的初创公司正在加速发展,可能还会出现新的公司,比如 Sam Altman 谣传中的价值 7 万亿美元的芯片公司。一批科技公司包括 Google、Intel 和 Qualcomm 正在联合起来挑战 NVIDIA 的秘密武器:其 CUDA 软件,这款软件使得开发者依赖于 Nvidia 芯片。
我们的看法是:随着 GPU 短缺现象的缓解,NVIDIA 短期到中期可能会面临一些下行压力,但从长远来看,AI 芯片制造商的未来仍然一片光明。
- 开源 AI:美事过多?
这个话题有点挑战性。我们是开源 AI 的坚定支持者,显然这已经成为过去一年甚至更长时间的一个主要趋势。Meta 大力推动其 Llama 模型,法国 Mistral 项目从引发争议到成为生成式 AI 的新星,Google 发布了 Gemma,而 HuggingFace 作为一个充满活力的开源 AI 社区继续上升,汇聚了众多模型。一些最具创新性的工作已经在开源社区中完成。
然而,在开源社区中,人们普遍感受到了一种“膨胀”。如今,可用的开源 AI 模型已达数十万之众。其中许多不过是供人娱乐的小玩意或周末时光的产物。这些模型的受欢迎程度忽高忽低,有的甚至在几天之内便根据 Github 的星级(虽然这一衡量标准并不完美)飞速上升,然而最终却鲜有转化为真正有用的工具。
随着时间的推移,市场将会自我调节,一小部分成功的开源项目将会得到云服务提供商及其他大型科技企业的重点支持。但当前的爆炸式增长,已让许多人感到眼花缭乱。
- AI 究竟需要多少成本?
生成式 AI 的成本经济正在迅速变化。不出所料,这一领域的未来很大程度上依赖于成本问题——例如,若 AI 驱动的搜索答案的成本远高于传统的十个蓝链接,我们能否真正挑战 Google 的搜索霸主地位?软件公司能否在算法推断成本侵蚀了大量毛利的情况下,仍旧以 AI 为动力?
对于 AI 模型的客户或用户来说,有个好消息:在价格竞争方面,我们似乎正处于一个比预期更快速的“降至谷底”的阶段。开源 AI(例如 Mistral 等)和商业推断服务提供商(例如 Together AI、Anyscale、Replit)的并行兴起,将这些开放模型作为服务端点,成为了推动力之一。对客户而言,除了处理不同模型产生不同结果的复杂性之外,几乎没有切换成本,这对 OpenAI 和 Anthropic 构成了压力。一个明显的例子是嵌入式模型成本的大幅下降,其中包括 OpenAI、Together AI 等多家供应商同时降价。
从供应商角度看,构建和提供 AI 服务的成本依然高昂。据报道,Anthropic 花费其一半以上的收入支付给云服务供应商(如 AWS 和 GCP)以运行其大语言模型。此外,还有与出版商的授权交易成本。
但从积极面来看,作为生成技术用户,或许我们应当享受由风险投资资助的服务爆炸所带来的免费福利:
观看:MAD Podcast,特邀嘉宾 Brandon Duderstadt 和 Zach Nussbaum, Nomic。
- 大公司与 AI 的政治经济格局变迁:微软是否已经取得了胜利?
这是 2022 年末人们最初提出的问题之一,到了 2024 年,这个问题变得更加关注:大型科技公司是否会占据生成式 AI 大部分价值的高地?
AI 的力量在于规模 - 更多的数据、更强的计算能力以及更多的研究人员往往意味着更强大的 AI 能力。对此,大型科技企业有着深刻的认识。不同于之前技术转型中的传统企业,它们对即将到来的颠覆保持着敏锐的反应。
在众多大型科技公司中,微软的策略运作宛若高维棋局。显著的是微软与 OpenAI 的深入合作,自 2019 年首次投资以来,目前已累计投资 130 亿美元。此外,微软还与开源对手 Mistral 建立了合作关系,并且在最近以引人注目的方式,收购了 ChatGPT 的竞争者 Inflection AI (Pi)。
所有这些合作关系的底层逻辑,似乎都是为了增加对微软的云计算服务 - Azure 的需求。到 2024 年第二季度,Azure 的收入年增长率达到了 24%,总额达到 330 亿美元,其中 AI 服务贡献了 6 个百分点的增长。
与此同时,谷歌和亚马逊分别与 OpenAI 的竞争者 Anthropic 进行了合作和投资(截至目前,亚马逊在其计划的 40 亿美元投资中,刚刚完成了第二笔 27.5 亿美元的投资)。亚马逊还与开源平台 Hugging Face 建立了合作。据报道,谷歌和苹果正在讨论将 Gemini AI 整合到苹果产品中。Meta 通过全面开放源代码的 AI,可能在背后超越了所有人。此外,中国的动向也十分值得关注。
这引发了一个明显的问题:对于初创公司而言,他们有多少成长和成功的空间?一些顶尖的初创公司(主要是 OpenAI 和 Anthropic,Mistral 可能很快会加入)似乎通过建立正确的合作关系,已经达到了快速成长的“逃逸速度”。然而,对于许多其他初创公司,包括那些资金充裕的公司,他们的未来仍然充满不确定性。
从 Inflection AI 选择被收购,以及 Stability AI 首席执行官面临的困境中,我们是否能看出,对于一些第二梯队的生成式 AI 初创公司来说,实现商业成功更加困难?
- 对 OpenAI 的迷恋 - 还是持有保留意见?
OpenAI 持续成为焦点 - 它的 860 亿美元估值,收入的快速增长,以及其内部的复杂动态,Sam Altman 更是被誉为这一代的 Steve Jobs:
关于这个话题,有几个引人深思的问题:
OpenAI 是不是野心太大了? 在所有那些 11 月引人注目的动态发生之前,OpenAI Dev Day 已经清楚地表明了一件事:在人工智能领域,OpenAI 想要做到全面覆盖,无论是深度整合各个层面(全栈式发展),还是广泛涉及各种应用场景(横跨多个领域):从模型构建、基础设施搭建,到消费者搜索、企业服务、数据分析、开发工具、在线市场等各个方面。对于一个在巨大技术转型初期就处于领导地位,并且几乎可以无限制地获取资本的初创公司来说,这并非全新的策略(比如 Coinbase 在加密货币领域就曾采取过类似的做法)。但这确实值得关注:虽然理论上这能让人工智能领域的竞争格局(MAD Landscape)变得更加简明,但在竞争愈发激烈的现实环境中,这无疑是一个艰巨的执行挑战。从 ChatGPT 出现的懒惰问题,到其市场活动效果不尽如人意,这些都暗示了 OpenAI 也无法完全逃脱商业规律的束缚。
OpenAI 和 Microsoft 的合作会走到尽头吗? 与 Microsoft 的合作关系一直很引人关注 —— 显然,Microsoft 的支持为 OpenAI 提供了巨大的资源推动,包括计算资源和 Azure 在企业市场的分销渠道,初期这一行动被广泛认为是 Microsoft 捕捉生成式人工智能浪潮的高明之举。然而,正如之前所述,Microsoft 已经明确表示它并不完全依赖 OpenAI(因为它拥有所有的代码、模型权重和数据),它还与其他竞争者(如 Mistral)建立了合作关系,并且通过收购 Inflection AI 强化了自己的 AI 研究团队。
那么,面对这样的局面,OpenAI 是否还愿意继续将自己的命运仅仅与 Microsoft 捆绑在一起,而不是寻求在其他云平台上部署呢?
鉴于 OpenAI 的宏伟目标和 Microsoft 对全球领导地位的追求,这两家公司何时会意识到他们之间更多的是竞争关系而非合作伙伴?
- 2024 年将成为企业级 AI 的元年吗?
正如前文所述,2023 年对于企业来说似乎是一个转折点,大家都在争先恐后地尝试拥抱新趋势,但除了一些概念验证项目之外,并没有太多实质性的进展。
在 2023 年,像 Accenture 这样的公司可能成为生成式 AI 最大的赢家,据说仅 AI 咨询服务就为它们带来了 20 亿美元的收入。
然而,人们仍然抱有极大的期待,认为 2024 年将是企业级 AI 大放异彩的一年 —— 或至少对生成式 AI 而言是这样,因为传统 AI 在企业中已经占据了相当的地位。
不过,我们仍在探索阶段,试图解答一些全球顶尖企业所面临的关键问题。
*哪些场景在使用?*目前,我们已经发现一些比较容易实现的应用领域,主要包括:a) 为开发团队提供代码生成辅助工具,b) 企业知识管理(比如搜索、生成文本摘要、进行翻译等),以及 c) 用于客户服务的 AI 聊天机器人(这一应用早于生成式 AI 的出现)。当然,还有更多其他应用(如市场营销、自动销售开发代表等),但我们还有很多细节需要梳理(比如是作为辅助工具还是完全自动化)。
*我们该如何选择工具?*从以上讨论来看,未来似乎是采用混合方式,即商业和开源工具的结合,大型和小型模型,以及横向和纵向的生成式 AI 工具。但初始步骤应该是什么?
*谁来负责这些工具的部署和维护?*全球 2000 强公司中存在明显的人才缺口。如果你认为招聘软件开发者已经足够困难,那么招聘机器学习工程师可能会更加棘手。
我们怎样防止它们做出错误的判断?确实,为了防止生成式 AI 工具做出错误判断,我们做了大量的工作,包括开发 RAG、设置防护栏、进行评估等,但这些工具可能仍会出错。更重要的是,我们实际上并不完全了解生成式 AI 模型的工作原理,这在企业应用中是个大难题。
*投资回报如何?*大型科技公司是最早利用生成式 AI 满足自身需求的,他们展示的初步数据颇为有趣。例如,在其财报电话会议中,帕洛阿尔托网络提到他们的 T&E 服务成本减半,ServiceNow 则提到开发者创新速度提高了 52%。但是,我们仍处于初步阶段,对于在企业中应用生成式 AI 的成本与收益尚无清晰认识。
生成式 AI 供应商的一个好消息是,企业客户非常愿意(重要的是,不再是仅仅作为“创新”预算,而是作为实际的运营支出预算,可能还会从其他项目中调拨)分配预算和资源来探索这一领域。但我们可能需要面对一个 3 至 5 年的部署周期,而非仅仅一年。
观看:MAD Podcast,特邀嘉宾 Florian Douetteau, Dataiku 的 CEO。
- AI 会结束 SaaS 的时代吗?
这是过去一年中的热门讨论话题之一。
讨论的一个观点是:AI 让编程变得更加简单,即使是几个水平一般的开发者,也能够创建出一款定制化的 SaaS 产品来满足特定需求。当能够自主开发时,为什么还要向 SaaS 提供商支付高额费用呢?
再谈另一个未来版本:一个可能由多个模型构成的统一 AI 智能,将管理你整个公司的运作,涵盖人力资源、财务、销售等各个领域,通过一系列 AI 代理实现全自动化和无缝衔接的运营。
虽然我们距离这两种趋势的全面实现似乎还有一段距离,但众所周知,在 AI 领域,变革来得飞快。
目前,随着 AI 技术被整合进每一个 SaaS 产品,预示着这些产品将变得更加强大,这似乎是一个更可能的未来趋势。
- AI 将如何重塑风险资本界?
先不论 AI 是否能够自动化风险资本的有趣讨论,无论是在选择投资公司还是投后价值增值方面,都有一系列关于风险资本是否为迎接 AI 时代做好了正确配置的问题:
风险资本规模是否太小? 诸如 OpenAI 这样的企业已经筹集了数十亿美元,未来可能还需筹集更多。这些资金很大一部分是通过大公司如微软等提供的,可能主要采取计算资源换取股权的形式。当然,很多风投也在大型基础模型公司上做出了投资,但这明显偏离了传统的 VC 软件投资模式。AI 时代或许需要更大规模的风险资本基金——目前看来,沙特阿拉伯正与美国的风投公司合作,准备推出一个高达 400 亿美元的 AI 基金。
或者,风险资本的规模已经太大了? 如果 AI 真的能将我们的生产力提高 10 倍,包括超级程序员、自动化的销售开发代理以及自动生成的营销内容,我们即将见证由极简团队(或许只需一人)运营的全自动化公司的兴起,这些公司理论上能实现数亿美元的收入——甚至可能上市。
一个年收入达到 1 亿美元的公司,在其成长过程中,真的需要风险资本的介入吗?
- AI 是否将为消费市场带来新生?
自社交媒体和移动设备时代以来,消费市场一直在寻找新的增长点。生成式 AI 可能正是这一增长点的契机。
其中一些值得关注的领域包括:
-
搜索:几十年来首次,谷歌的搜索垄断面临了早期但具有可信度的挑战。一批创新的初创公司,如 Perplexity AI 和 You.com,正引领从传统的搜索引擎向提供直接答案的引擎转变。
-
AI 伴侣:超越反乌托邦的想象,想象一下,如果每个人都拥有一个无比耐心且能够针对个人需求提供知识、娱乐或治疗建议的 AI 伴侣,会怎样?
-
AI 硬件:Humane、Rabbit、VisionPro 等公司正在消费硬件领域引起轰动,预示着技术的新发展方向。
个性化定制娱乐: 随着生成式 AI 工具不断进步(变得更便宜),我们将如何创造出新型娱乐和艺术形式?
推荐观看:
- MAD Podcast 访谈 Aravind Srinivas, Perplexity AI 的 CEO (可在 Apple, Spotify 收听)
- MAD Podcast 访谈 Richard Socher, You.com 的 CEO (可在 Apple, Spotify 收听)
- MAD Podcast 访谈 Cris Valenzuela, Runway 的 CEO (可在 Apple, Spotify 收听)
- AI 与区块链:空谈,还是有潜力的新兴领域?
我明白,提到 AI 和加密货币的结合,很容易让人想到社交媒体上的玩笑。
然而,一个不争的事实是,AI 正逐渐被少数几家大公司垄断,这些公司不仅技术先进,还拥有大量的计算资源、数据和顶尖 AI 人才——从各大科技巨头到名不副实的“开放”AI 组织。与此同时,区块链的核心优势在于其能够创建去中心化网络,让参与者能够共享资源和资产。这是一个值得深入探讨的领域,正如我们几年前就开始研究的那样(参见这里的演示)。
一些与 AI 关联的加密项目取得了显著进展,包括 Bittensor*(一个去中心化的机器智能平台)、Render(一个去中心化的 GPU 渲染平台)、Arweave(一个去中心化的数据平台)。
尽管我们在今年的 MAD Landscape 中没有专门讨论加密货币,但这确实是一个值得关注的领域。
问题始终是,加密行业是否能够避免沦为数不胜数的 AI 相关梗币、操纵市场和诈骗的陷阱。
未讨论的其他热点话题:
- AI 是否会导致人类灭亡?AI 末世论者与加速论者的辩论
- 监管、隐私、伦理、深度伪造的问题
- AI 创新是否只能在旧金山进行?
第三部分:融资、并购与 IPO
融资情况
当前的融资环境呈现出“一分为二”的局面,AI 领域与其他领域截然不同。
总体上,资金投入在 2023 年下降了 42%,降至 2484 亿美元。2024 年初的几个月里,虽有若干积极迹象,但整体趋势并未发生显著变化。
正因为前文提到的种种原因,数据基础设施领域的投资活动寥寥无几,Sigma Computing 和 Databricks 算是罕见的例外。
而 AI 领域的情况则截然不同。
AI 资金市场的几个显著特征包括:
- 巨额资本主要流向少数几家初创公司,尤其是 OpenAI、Anthropic、Inflection AI、Mistral 等。
- 企业投资者的参与度异常高。2023 年对 AI 领域投入最多的三家公司分别是 Microsoft、Google 和 NVIDIA。
- 上述企业交易中,实际现金与“以计算力换取股权”的比例有些不明朗。
自我们 2023 年的市场动态分析报告以来,以下是一些引人注目的交易,它们大体上按时间顺序排列(这并不是一个完整的列表):
OpenAI,作为领先的基础模型开发者,通过两次融资共筹得 103 亿美元,目前估值高达 860 亿美元。另一位场上的重要玩家Adept,成功筹资 3.5 亿美元,估值达到了 10 亿美元。在金融服务市场研究领域,AlphaSense通过两轮筹资总计收入 4.75 亿美元,现估值为 25 亿美元。Anthropic,同样是基础模型的开发者,在三次筹资活动中累计获得 64.5 亿美元,估值达 184 亿美元。
在特定技术领域,Pinecone的向量数据库平台获得 1 亿美元融资,估值为 7.5 亿美元。专注于光互联技术的Celestial AI,在两轮融资中筹得 2.75 亿美元。作为 GPU 云服务的提供者,CoreWeave获得了 4.21 亿美元的融资,估值达到 25 亿美元。而开发光动力芯片的Lightmatter,在两轮融资后,估值上升至 12 亿美元。
数据分析平台Sigma Computing筹集资金 3.4 亿美元,估值达到 11 亿美元。Inflection和Mistral这两家基础模型开发商分别筹资 13 亿美元和 5.28 亿美元,估值达到了 40 亿美元和 20 亿美元。Cohere,又一基础模型开发商,融资 2.7 亿美元,估值同样为 20 亿美元。
在视频与代码生成领域,Runway和Synthesia*分别通过融资活动筹得 1.91 亿美元和 9000 万美元,估值分别为 15 亿美元和 10 亿美元。面向开源模型的机器学习与数据科学平台Hugging Face,融资 2.35 亿美元,估值为 45 亿美元。专注于代码生成和软件开发的Poolside与Magic,分别筹资 1.26 亿美元和 1.17 亿美元,展现了这一领域的活跃融资趋势。
此外,Databricks、Shield AI、Glean、Lambda Labs等公司在各自的领域内也完成了重要的融资活动,进一步证明了 AI 技术在多个行业内的广泛应用和发展潜力。
并购及私有化动态
自 2023 年以来的 MAD 事件后,并购(M&A)市场显得颇为沉寂。
众多传统的软件买家更多关注于自家的股价与业务发展,而不是积极寻求并购机会。
此外,当前严格的反垄断法规为潜在的买家带来了更多挑战。
尽管如此,私募股权公司在这个不利的市场环境中依然活跃,寻找着价格更为合理的投资机会。
以下是近年来在 MAD 舞台上频频出现的公司中,一些引人注目的交易案例(按规模排序):
Broadcom(一家半导体生产商)以 690 亿美元收购了VMWare(一家云计算公司);Cisco(一家网络与安全基础设施公司)以 280 亿美元收购了Splunk(一家监控与可观测性平台);Qualtrics(一家客户体验管理公司)被Silver Lake与CPP Investments以 125 亿美元的价格私有化;Coupa(一家支出管理平台)被Thoma Bravo以 80 亿美元私有化;New Relic(一家监控与可观测性平台)被Francisco Partners和TPG以 65 亿美元收购;Alteryx(一家数据分析平台)被Clearlake Capital和Insight Partners以 44 亿美元私有化;Salesloft(一家收入协调平台)以 23 亿美元被Vista Equity收购,后者随后也收购了Drift(一家专注于客户体验的 AI 聊天机器人开发商);Databricks(一家数据湖仓库提供商)以 13 亿美元收购了MosaicML(一个 AI 开发平台)(还包括其他一些金额较小的公司,如Arcion和Okera);Thoughtspot(一家数据分析平台)以 2 亿美元收购了Mode Analytics(一个商业智能创业公司);Snowflake(一家数据仓库提供商)以 1.5 亿美元收购了Neeva(一个消费者 AI 搜索引擎);DigitalOcean(一家云托管提供商)以 1.11 亿美元收购了Paperspace(一家云计算和 AI 开发创业公司);NVIDIA(一家云计算芯片制造商)收购了OmniML(一个针对边缘计算的 AI/ML 优化平台)。
还有 Microsoft 对 Inflection AI 的“非典型收购”。
2024 年会是 AI 并购的大年吗?这很多都取决于市场持续的活力。
- 市场低端见证了众多具备强团队背景的 AI 初创公司在过去一至一年半时间里获得资助。在过去十年里的几轮 AI 热潮中,许多初创企业在首轮融资之后很快被收购——尽管这些公司实际吸引力与交易价格常常不成正比,但稀缺的 AI 人才一直是各方争抢的焦点,现在也不例外。
- 在市场的高端,领先的数据和 AI 平台之间进一步整合有着坚实的商业理由。不过,这类交易的成本可能会更高。
IPOs 究竟如何?
在公共市场,AI 已成为一个热门趋势。2023 年,被称为“七巨头”(Nvidia、Meta、Amazon、Microsoft、Alphabet、Apple 和 Tesla)的股票至少增长了 49%,带动了整个股市的上升。
然而,公共市场上真正纯粹的 AI 股票仍然极为稀少。那些能够上市的少数公司则获得了丰厚的回报——例如,Palantir 的股价在 2023 年飙升了 167%。
这为许多即将 IPO 的 AI 相关创业公司带来了积极信号。在机器学习、分析和数据(MAD)领域,有不少公司已经发展到了显著的规模,Databricks 就是其中的佼佼者,此外还有 Celonis、Scale AI、Dataiku* 和 Fivetran 等。
同时,OpenAI 和 Anthropic 如何看待公开市场,也是一个值得关注的问题。
不过,2023 年的 IPO 市场表现不佳,只有少数与 MAD 相关的公司成功上市:Klaviyo(一家营销自动化平台)于 2023 年 9 月以 92 亿美元估值上市;Reddit(一个论坛风格的社交平台,向 AI 公司提供内容许可)于 2024 年 3 月以 64 亿美元估值上市;Astera Labs(一个为 AI 和云基础设施提供智能连接解决方案的半导体公司)也在 2024 年 3 月以 55 亿美元估值上市。
结论
我们正生活在一个特殊的时代,处在一个范式转变的初期。现在是尝试新事物的最佳时机。我们的旅程才刚刚开始。