Gemini 与 Google 的文化观 [译]

上周三,当人们对 Gemini 的政治立场的讨论还仅限于其图像创造能力时,我曾直言不讳地批评这家公司过于保守

通常,我不愿意涉及政治或文化战争的讨论。但有时,必须清晰地指出某些事情的荒谬性。Google,乃至更广泛的科技公司界,对于偏见的指控向来敏感,这种态度也延伸至图像生成领域。我理解这种在描绘假设场景时的谨慎态度。然而,很多图像反映的是真实历史。这让我想起乔治·奥威尔在《1984》中的描述:

所有的记录被销毁或篡改,所有的书籍被重写,所有的图片被重新绘制,每一个雕塑、街道和建筑都被重新命名,每一个日期都被改动。这个过程仍在持续,每天每分钟都在发生。历史已经停滞,除了一个永恒的现在,党永远正确。我知道过去被篡改了,但即使是我自己进行的篡改,也无法证明。一旦事情完成,就不会留下任何证据。唯一的证据存在于我自己的记忆中,而且我不能确定还有其他人记得。

即使你不想完全引用奥威尔的政治隐喻,Google 对其模型进行过度审查的行为,最宽容的解释也只能是出于对批评的恐惧。然而,这同样是一种失败:Google 明显违背了其“整理世界信息,使之普遍可访问和有用”的使命,因为它害怕负面报道而创造出全新的现实。更严重的是,这对业务产生了负面影响:Google 虽拥有先进的模型和基础设施,但要在 AI 领域取得成功面对其商业模式的挑战需要勇气;为了避免批评而去改变世界信息的行为,即便是在最佳情况下,也透露出了深深的胆怯。

如果说胆怯是其行为的动机,那么公司在 Gemini 项目上的尝试显然已经彻底失败;尽管 Google 关闭了 Gemini 的图像生成功能,但其文本生成的荒谬程度丝毫未减:

这只是许多例子之一:Gemini 拒绝帮助宣传肉类产品(链接),撰写关于化石燃料的报告(链接),甚至不愿帮忙销售一条金鱼(链接)。它认为,加速主义本质上是一种暴力思想(链接),把自由主义者与斯大林相提并论(链接),并坚持认为,撤销网络中立性和希特勒造成的伤害孰重孰轻,难以判断(链接)。

尤其是将希特勒与其他人物比较的例子,这些比较明显荒谬且极具冒犯性;而其他的争议则相对较小。但它们共同表达了一个观点:如 Nate Silver 在另一条推文中所说(链接),这是一种反映旧金山市监事会中位成员政治倾向的态度。

不言而喻,坦率地表达这些观点绝非胆小之举,这也引发了 Silver 的进一步思考:

实际上,我认为 Gemini 并非无先例;就像许多现代谷歌的比较对象一样,它的前车之鉴来自于微软。

微软与文化诅咒

来自 Neowin(链接),2010 年的报道:

微软为 iPhone 举行的葬礼
微软为 iPhone 举行的葬礼
图片来源

2010 年,微软员工为了庆祝 Windows Phone 7 的正式发布,穿着节日服装,驾驶着装饰有 Windows Phone 标识的车辆,在雷德蒙德校区内举行了一场 iPhone 和黑莓的“葬礼”游行。除了奇装异服,他们还为这两款竞争对手的巨型模型制作了“灵车”,宣称已经用 Windows Phone 7 将这些竞争者“埋葬”。

这是一种狂热行为。我在 2013 年写的《文化的诅咒》(链接)中详细讨论过这个事件。时隔八年,我希望你能允许我引用一个较长的片段来讲述这一故事。

文化对于公司而言,既是其最强大的资产,也可能成为阻碍。当公司依靠某些基本假设迅速扩大规模时,这些假设同样会限制公司及时调整发展方向的能力。更严峻的是,公司文化往往让组织自身无法意识到需要转变。如 Edgar Schein 在《组织文化与领导力》中所述:

基本假设,正如实用理论所示,很难直面和质疑,因而更难以改变。要在这一领域内学到新东西,我们需要重新审视并可能需要改变我们认知结构中比较稳定的部分……这种学习过程本身就很困难,因为基本假设的重新审视会暂时让我们的认知和人际关系世界变得不稳定,引发大量的焦虑。面对这样的焦虑,我们更倾向于将周围的事件看作是与我们的假设相符,哪怕这意味着我们必须扭曲事实、否认真相、投射责任,或以其他方式欺骗自己。文化正是通过这一心理过程发挥出其最终的影响力。

微软在 iPhone 推出后的反应,或许是这种心态的最经典例证。现在回看,微软从 1985 年到大约 2005 年对计算机行业的控制力几乎无人能及。公司设定了一个宏大目标:“每个桌面和每个家庭都有一台运行微软软件的计算机”,并且成功实现甚至超越了这一目标:公司同样主导了企业级后端办公。这种空前的成功使得最初的信念转变为了一个坚不可摧的假设——认为所有计算机自然而然应该由微软驱动。因此,如果当时的 CEO Steve Ballmer 没有嘲笑 iPhone,那才真是令人震惊的事情。

一年半之后,微软意识到他们当时的手机操作系统 Windows Mobile 无法与 iPhone 竞争,于是开始了最终演变为 Windows Phone 的项目。但是,两个未经承认的文化假设依然存在:一是微软认为自己有足够的时间利用其无可匹敌的资源,从一开始可能不够完善但最终一定能够超越的信心;二是微软可以依靠 Windows 的统治地位和 Office 业务的优势。这两个假设在微软赢得浏览器之战和慢慢占领企业数据中心的过程中变得根深蒂固。几乎所有人在 Windows Phone 发布以及那场为 iPhone 举行的葬礼之前就已经意识到了这一点,他们甚至为 iPhone 举行了一场象征性的葬礼

Steve Ballmer 未能解决这一困境;他的最后举措是围绕 Windows 的“一体化微软”战略对公司进行重组,并且收购诺基亚来支持 Windows Phone。改变公司文化的任务落到了他的继任者萨蒂亚·纳德拉身上,这也是为什么他上任后第一次公开活动就是宣布 iPad 版 Office 这件事如此关键的原因。我曾写道

这正展示了 CEO 的力量。他们无法完成所有工作,也无法控制行业趋势。但他们可以选择是否接受现实,从而影响他们领导下的每一个人的世界观。

在纳德拉的领导下,微软在过去三年里经历了巨大变革,将自己定位为一个与设备无关的服务提供商;尽管如此,它仍需面对亚马逊云服务、开源工具的挑战,以及用户在过去六年中逐渐适应了一个没有微软软件的世界。如果微软能在 2007 年正视现实,公司可能会更加强大,但是公司文化让这成为了不可能。

与微软举行 iPhone 葬礼时相比,Google 的处境远没有那么糟糕。公司的收入和利润空前高涨,特别是 Gemini 1.5 的发布,展示了该公司在 AI 时代的优势地位:不仅在研究上处于领先地位,还拥有支持全新而有价值应用场景的独一无二的基础设施。但这正是 Gemini 失败引人注目的原因。

不作恶

到目前为止,围绕 Google 和 AI 的讨论主要集中在商业模式上。在去年的《AI 与五大巨头》一文中,我提到柯达虽然发明了数码相机,但因为商业模式的考虑而没有深入开发,我还将此与 Google 似乎难以推出新产品的状况进行了比较:

Google 长期以来一直引领使用机器学习技术改善其搜索引擎和其他面向消费者的产品(并通过 Google 云平台将此技术作为服务提供)。但搜索服务始终依赖于人作为最终的决策者:Google 提供链接,而是由用户点击决定哪个链接是他们想要的。这一理念同样适用于广告:20 年前,广告收费模式革命性地从按展示次数收费转变为按点击收费,因为确定展示价值非常困难。这意味着,广告效果的好坏,由目标受众点击与否来决定……

然而,这种情况更应引起 Google 管理层对于在搜索领域,生成式 AI 可能构成颠覆性创新而非持续性创新的担忧。颠覆性创新在最初往往不如现有产品,这也是为什么它容易被那些自信他们当前产品更优的管理者忽视。问题在于,随着时间推移,颠覆性产品会逐渐改进,而现有产品可能变得更加臃肿、使用起来更加困难——而这正是 Google 搜索目前的发展趋势所似。

Google 已经开始推出新产品,而且,Gemini 1.5 的发布标志着一个令人难以置信的技术突破;但是,围绕 Gemini 的争议也提醒我们,企业文化同样能够制约成功。Google 有一个非官方的座右铭——“别做恶”,这是创始人拉里·佩奇在公司的初期公开文件S-1中所阐述的理念。

不作恶。我们深信,从长远来看,作为股东及在其他方面,坚持做对世界有益的事情即使牺牲了一些短期利益,也会让我们得到更好的回报。这是我们文化中的重要组成部分,也是公司内部广泛认同的价值观。

谷歌的用户依赖我们的系统,在医疗、财务等多个重要领域做出决策。我们提供的搜索结果,是我们能够做到的最好效果。这些结果是公正无私的,我们绝不接受任何形式的支付来影响结果的展示或更新频率。我们同样展示广告,并努力使其相关性最大化,同时清晰标明广告身份。这与报纸上的做法类似,广告明确标识,内容不受广告商支付影响。我们认为,让每个人都能够获取到最优质的信息和研究成果至关重要,而不仅仅是那些人们愿意为之付费的信息。

谷歌基本上遵循了这一承诺,至少按照佩奇所定义的那样:公司不会出售搜索结果的排名。当然,公司让广告越来越像自然搜索结果,搜索结果页面也包含了越来越多的内容,并且在越来越多的领域进行了优化,但是,尽管总有些关于搜索结果里包含什么、不包含什么,以及算法决策的指摘,大部分人仍然信任谷歌,并每天频繁地使用它。

不过,人们不禁会想,对谷歌内部的一些人来说,搜索是不是并非如此神圣不可侵犯。2018 年,一段 2016 年大选后的全员大会视频泄露,视频中谷歌高管对选举结果表示失望,这一事件的影响足够大,以至于谷歌感到有必要发表声明:

在一次定期的全员大会上,一些谷歌员工和高管表达了他们对漫长且分裂的选举季节后果的个人见解。在谷歌超过 20 年的历史中,每个人都可以在这些会议上自由地表达他们的意见。在那次会议上,或者任何其他会议上,都没有任何言论表明任何政治偏见曾经影响过我们的产品构建或运营方式。相反,我们的产品是为了每个人而构建的,我们用极大的细心设计它们,确保它们对每个人都是一个可信的信息来源,不论政治立场如何。

对某些员工而言,这可能看起来是一种与时代脱节的观点;我不禁回想起 Angela Y Davis 的名言:“在一个种族主义社会中,仅仅自诩为非种族主义者是远远不够的,我们必须积极反对种族主义。”这种观念认为,单纯呼吁在机会上实现色盲是不充分的;唯一被接受的结果应是实现真正的平等。对 Google 而言,这意味着仅仅避免作恶是不够的;它还必须积极地去“反恶”。

这样的最终结果导致,正如微软曾凭借 Windows 的垄断地位,自欺欺人地相信自己拥有颠覆 iPhone 的产品一样,Google 也因多年的搜索垄断地位,自我催眠,认为自己不仅有权也有责任向用户指明他们应当信仰什么。

后 Gemini 时代

在之前的摘要中,我提到过,我力求在 Stratechery 上避免讨论政治问题;我的兴趣更倾向于探讨商业模式和对社会的影响。虽然这些讨论不可避免会涉及政治,但我希望避免其变成党派之争(举个例子,我认为这篇关于 2016 年选举的文章至今仍十分中肯,且完全不带有党派偏见)。然而,AI 的发展让我们似乎没有选择的余地,必须面对这些问题。

因此,我去年秋天写的一篇关于拜登行政命令的文章《创新的抑制》显得不够全面:我们不仅要认识到 AI 带来的巨大潜在好处,更应该让开源模型的发展成为可能。无论是 Google 还是 OpenAI,他们都有权按自己的视角训练模型。但是,一个真正意义上的自由观念,应该为替代方案的开放市场留出空间,即支持开源。

其次,我和科技界的其他人士都应该撰写像您现在阅读的这类文章。因为到目前为止,最大声音往往来自于“旧金山市监事会中位成员的政治立场”,许多人只是希望构建新奇的东西或是撰写文章,而不想因此失去工作或在社交媒体上遭受攻击。这种情况虽然造成了一种科技界与社会脱节、甚至是采取威权态度的假象,我不认为这是真的。然而,对于我们这些不愿意强加观点于人的人来说,有必要明确表态。

最后,最大的问题指向了 Google。该公司凭借其研究和基础设施本应在 AI 领域占据主导地位。然而,文化上的障碍,超过了商业模式的考量,显得尤为突出。对 Google 管理层最宽容的解读是,他们和我们一样,只是想开发产品,而不想遭受公众指责。但这种态度并不等同于领导力。正如 Schein 所述:

深入探讨文化和领导力,我们发现它们是一枚硬币的两面,互不可分。文化规范决定了一个国家或组织如何看待领导力——谁将被提拔,谁能吸引追随者的目光。反过来,领导者真正重要的作用,就是创造和维护文化。领导者的独到之处在于他们对文化的理解和操作能力,而当文化被认为是有害的时候,改变文化便是领导力的最高体现。

正如 Nadella 在微软所实施的那样。在《Windows 的终结》一文中,我详细叙述了 Nadella 是如何改变微软与 Windows 的关系,从而开启了其监管期间发生的爆炸性增长,包括公司在 AI 领域的领先地位。

显然,谷歌也迫切需要进行一次类似的变革:公司的核心目标不应是指导用户该怎么思考,而是要帮助他们做出重大决策,正如 Page 曾经所承诺的。这首先意味着要清理那些被谷歌的权力所吸引、企图利用这种力量推行自己政治议程的员工,把决策权交回给那些真心想要打造优秀产品的人手中。这也意味着,必须清除那些纵容前者横行的人,甚至包括 CEO Sundar Pichai。考虑到对谷歌乃至整个社会的重大影响,我们不能仅仅保持沉默,希望旧金山市议会能够自行恢复理性。