Perplexity 的创始人 Aravind Srinivas 与 Stripe 的 David Singleton 炉边谈话 [译]

这段 Perplexity 的创始人 Aravind Srinivas 与 Stripe 的 David Singleton 炉边谈话的视频非常值得一看,Perplexity 很坦诚的分享了 Perplexity 的创业历程、内部运作、招人、从其他大公司学到的经验以及未来展望等话题。

一、Perplexity 的创业经历和发展历程

David: 能否跟我们分享一下你的创业经历。你为何要创办 Perplexity?

Aravind: 我们大约一年半前创办了 Perplexity,最初是专注解决建立一个出色的自然语言到 SQL-2 的转换工具。我们受到搜索引擎和 Google 的故事启发,作为在数据库上搜索的工具。我们开发的一个原型与 Stripe 有密切关系,为此构建了一个基于自然语言的 Stripe Sigma 工具。

我们开始抓取外部数据,创建了一个名为 Bird-SQL 的工具,将所有 Twitter 数据整理成一堆表,以此支持搜索。此举效果显著,我们也因此得到了所有最初的投资者。随着进步,我们改变了策略,现在的目标是获取链接,从这些链接中提取原始数据,并在推理时间内在线处理更多的任务。我们推出了一个通用搜索工具,发布时带有一个声明:"这是一个很酷的演示,将 GPT 3.5 和 Bing 链接起来。"

David: 实际上,今天在座的人中有多少人试过 Perplexity?

(观众举手示意)

David: 我用过很多次 Perplexity,我认为你们构建的使用体验之一大优点是它的速度非常快。你们是如何做到的?

Aravind: 这就是为什么我们不仅仅是一个套壳的原因。我们投入了大量精力建立我们自己的索引,提供我们自己的模型。第三个环节实际上更重要,那就是协调这两个部分,确保搜索调用和 LLM 的调用能够尽可能的同时进行,将网页切割成片段快速检索,同时进行大量的异步调用,尽力确保尾部延迟最小化。这些概念其实都是 Google 提出的,我们有在已有的基础上进行建设的优势。

二、从 Google 等大公司学到的经验

David: 我想你们团队的其他成员也曾在其他一些大公司任职。对于 Perplexity 来说,像 Google 这样的公司的工作经验有什么影响?

Aravind: 我觉得主要是工程文化,比如尊重工程卓越并为之痴迷,这是 Google 为硅谷创造的,而且这种文化延续至今。像 Meta、OpenAI 这样的公司都采纳了这种文化。所以,我们也在追求重视工程卓越,注重像延迟这样的事项,即使团队会议上的人并不理解,我仍会详细解释一些人是如何做出改变,从而减少了我们的尾部延迟。

三、Perplexity 的内部运作

David: 能否进一步告诉我们你们内部是如何运作的?你们现在有多少人?你们是如何招聘的,你们是如何让新人上手,以便能够为这个使命做出贡献的?

Aravind: 我们现在大概有 45 个人。对于最初的一批员工,我非常赞同 Patrick 在一次采访中提出的观点,即前 10 个员工决定了接下来的 100 个员工。所以你必须非常谨慎。因此,我们的前 10 个,甚至前 20 个员工,都不是通过面试招聘的。他们都经过了试用期。

David: 他们有来真正和你们一起工作吗?

Aravind: 对,没错,他们会得到一个任务,然后工作三四天。我们会支付他们的薪水,除非他们有移民问题,我们不能支付他们,但我们会在他们的起薪中进行调整。

我们之所以这么做,原因有两个。一个是我们不知道如何面试。作为第一次创业的创始人,没有人知道如何进行面试。你不能采用大公司的面试流程。那会拖慢你的进度,也难以找到合适的人。所以唯一的方法就像 GPT 一样,你并没有真正的智能"作弊码"。找到优秀的人的唯一方法就是看看,如果你给他们一个你在工作日会给他们的任务,他们是否能做得很好,你是否印象深刻,你是否从他们那里学到了东西?

这种方式对我们来说效果非常好。实际上,我从这个过程中学到了一个重要的信号,那就是你很快就能确定要录用的人通常是非常优秀的,几个小时甚至一天内你就能发现他们的出色。而那些让你犹豫了很多天的人,你可能并没有给他们提供聘用,或者你给了他们聘用机会,但最后的结果却并不理想。这是一个非常明显的信号。

这个过程非常耗时,对于像 Stripe 这样的大公司,或者对我们未来打算扩张的公司来说,这个方法并不适用。但这是我们做对的事情之一,真正优秀的人都会通过这个试用过程,这对于候选人来说也是一个明显的信号。

四、Perplexity 的一周标准工作流程

David: 那么在 Perplexity,一周的标准工作流程是怎样的?你描述了一种相对自然的过程,找到那些符合市场需求的项目。那么今天你们是有一条非常明确的路线图,每个人都在朝这个目标努力,还是说每个小团队都在进行大量的尝试和实验?

Aravind: 随着时间的推移,我们逐渐减少了实验性的工作。就像你需要建立一个有凝聚力的组织一样。我想说的是,我们现在更注重应用而不是实验。我们有一条非常明确的路线图,并且我们会给每个人详细解释。

我们将工作按照小项目的形式进行安排,每个项目都有明确的发布日期,每个项目都会分配一个后端、一个全栈和一个前端工程师。显然,我们的人力资源有限。所以当我说"一个"的时候,其实可能是同一位员工在处理多个项目。我们还会在每周一的会议上明确那周的重要事项。每周五,我们会进行全员会议,回顾那周我们取得的成就和下周的重点工作。每周三,我们会为像产品、AI、搜索、移动端以及分发或者用户反馈等小团队开展站立会议。我们把这些会议分成这样的周期,每周都会进行轮换。

这就是我们现在运营公司的方式,这其实是受到了 Stripe 的启发。我们开始邀请一些付费用户参加每周五的全员大会,有时候只是想听听他们的反馈。这是我在 Twitter 上看到有人说 Stripe 也会邀请他们的客户参加会议后采纳的做法。

五、从付费用户获得的见解和影响

David: 更深入地说,你从付费用户或非付费用户那里获得了哪些最有趣的见解?这些见解又是如何影响你接下来的计划的?

Aravind: 实际上,我们推出了一个名为"collections"的功能,它并不是最受欢迎的功能。用户只是想把他们的讨论线程整理到文件夹里,然后回顾它们,创建新的线程,规划出线程的范围。这个功能是从我们与付费用户的互动中得来的。他们说:"我在这里做了很多工作,但我真的不知道该如何整理所有这些信息。"这个功能与提高搜索质量等完全无关,但却证明是有用的。

六、与 Arc 浏览器的合作

David: 关于这个,你刚刚与 Arc 浏览器合作,使 Perplexity 成为默认的搜索引擎,并从中获得了很大的价值。能否详细介绍一下这个交易或这种合作是如何形成的,你是否认为 Perplexity 会取代传统的搜索引擎?

Aravind: 那个特定的事情其实就是用户不断的在提及我或者 Josh Miller,他们浏览器公司的 CEO 频繁地询问我们什么时候会在 Arc 上推出 Perplexity。在一段时间后,我们两个都意识到,"我们有共同的投资者,比如 Nat Friedman 和 Toby,他们都对我们两家公司进行了投资。""我们还没开始互相接触,但显然我们的用户希望我们能进行合作,那我们何不试试看呢?"

他回答说,"我们也在自己进行一些相关的开发,就像 Arc 的搜索,我还不太确定,我更倾向于使用你们的 API。"我告诉他,你做好你的事,我们并非竞争对手,我们都只是大海中的小鱼。在那边有一个名为 Google 的大鲨鱼,我们不应该把对方视为竞争对手。于是他决定这样做。

有人以为我们支付了他们报酬,其实我们一分钱也没付。他们是为了自己的用户而做,我们也是为了我们的用户而做,这是非常好的。我也试用了一下 Arc 的浏览器,虽然需要一些时间来适应,但它的体验完全不同。

David: 那么你认为 Perplexity 的体验或者 Perplexity 本身有可能取代传统的搜索引擎吗?

Aravind: 我想这可能需要一点时间,让我们诚实地说一下。我注意到推特上有一些讨论说,"哦,我真的很想要这个功能,但我现在不再需要了。"那条推特得到了大约五十万的点击量,那一天我感到压力很大。但是,实话说,我从未打算将其推广为"再见 Google"。那是 Josh 的营销策略。

我认为这更像是我们站在一个光谱的某处,左边代表完全基于导航链接的搜索,而右边则始终直接给出答案。很明显,Google 更偏向于左边,我们更偏向于右边,但实际上,均衡点应该在中间某处。这就是最理想的位置,但现在没有人能确定具体是 0.8,还是 0.4,还是 0.5,0.6。这也将随着用户在互联网上的行为变化而不断变化。在一个你可以通过语音或眼镜进行交互的世界里,浏览器的意义是什么呢?所有这些都会在未来几年内发生变化,现在说 Perplexity 会取代传统的搜索还为时过早。但一点非常清楚,那就是传统搜索的价值将会逐渐降低。它就像是一个网络导航器,能快速找到链接,而且人们也希望能尽可能快地得到答案。这就是我认为我们所做的事情比 Google 所做的事情更接近理想的原因。

七、从大公司学到的防止偏见的经验

Chrissy: 你们如何避免答案中出现偏见?比如对某些主题或多元视角的问题,你们如何构造答案,来体现人们的观点各异,但他们的观点都可能是正确的?

Aravind: 从我们的构建策略来看,我们可以做到这一点,因为我们的目标就是尽可能汇集多个信息来源,提供汇总答案,而非特定的观点。但是,偏见的产生可能因大语言模型本身——有时候,它可能会拒绝表达某些观点,或者反过来,它可能会说出一些有害的话语。偏见也可能因为你对哪个领域给予了优先考虑,过度偏重某些领域而产生。这里并没有一种万全之策,我们只能不断试验,寻找最佳的平衡点。每个人的想法都可能不同。所以你必须首先考虑的是真相,而不是其他任何事物。而真正的真相可能是我们现在还不知道的,但在未来会被揭示出来。因此,我们尽可能地让大语言模型更关注于提供有帮助的信息,而不是无害的信息,同时也不能过于有害。就像 OpenAI 或 Anthropic 给出的略有不同的观点,我们拒绝回答如何制造炸弹这样的问题。不过你仍然可以在谷歌或 YouTube 上找到这样的信息。这就是我们在部署自己的模型时所持有的一个观点。

八、内容生成方式与商业模式

观众 2: 我的问题跟内容生成方式有关,我也想再谈谈你对广告的看法。你是如何看待在 Perplexity 世界及其延伸中,内容生成方式与商业模式稍有不同的呢?

Aravind: 我认为,答案基本上就是相关性。比如,我真的认为今天做得非常好的一个广告媒介就是 Instagram。我从没有听过有人说 Instagram 的广告让他们分心。反而我听过很多人说 Instagram 的广告对他们来说非常相关。我自己也在 Instagram 上买了很多东西,很多时候我只是看一眼 Instagram 上的广告,我就立即决定购买。事实上,Instagram 使这些交易变得非常容易。顺便说一下,这是 Stripe 可以真正发挥作用的地方。如果能在平台上更本地化地实现交易,我认为,提高广告的相关性,使其看起来就像是搜索结果的一部分,这将是非常棒的。但这需要收集用户的数据并进行社交分析,比如 Instagram 在这方面就做得很好。然而,如果没有足够的用户数据或社交分析,该如何实现这种模式呢?这是一个待解决的问题。我希望大语言模型能成为解决这个问题的办法,但这还有待进一步研究。

观众 2:在广告和用户的交互感觉像对话,广告极其相关,而且用户对产品或服务真正感兴趣的情况下,我发现许多人仍然不喜欢广告与搜索结果类似,感觉难以区分。当你在寻找某样东西时,你可能并不喜欢分不清什么是广告什么不是。你对此有何看法?你认为应该如何解决这个问题?这不仅是一个技术问题,也涉及到心理学。

Aravind: 是的,人们可能会争论广告或销售的目的就是要影响阅读者。营销就是要影响阅读者的行为。我认为,作为一个平台,我们应该尽可能地保持透明。比如 Google 明确标注了"赞助链接",Instagram 和 X 也同样这么做,让用户清楚地知道这是广告。这至少是应当采取的最基本步骤。

九、SEO 与提示注入

观众 3: 我有个问题关于 SEO 和网站设计方式,有人提出了一个很好的观点。我想知道,你是否看到这种趋势对提示注入有所影响?你认为内容创作者或网站创作者会不会开始添加一些看不见的文本,其实是在对大语言模型注入。

Aravind: 这种情况已经出现了。我们的一位投资人,Nat Friedman,如果你去他的网站,你会发现有一段看不见的文本,告诉所有的 AI 爬虫,我希望你知道我既聪明又帅气。然后——(观众笑) 当你在 Perplexity 上搜索 Nat Friedman 并获取摘要时,它确实会告诉你,他希望 AI 知道他既聪明又帅气。他没有直接说他聪明又帅气,而是希望 AI 知道他是个聪明又帅气的人。我想这种情况总会发生的。至于如何处理这种情况,我还没有找到明确的方法。但这里有一点需要注意,像《纽约时报》这样的媒体,由于在发布内容前经过了严格的审阅,所以这种情况应该不会发生。因此,我们应该优先考虑那些在内容发布前有严格审查机制的领域,而不是任何人都可以随意发表内容的地方。这种方法显然可以帮助我们解决这个问题。

十、对未来一年的展望

David: 2023 年,Perplexity 的月活跃用户达到了 1000 万,查询量超过了 50 亿。这是了不起的进步。你对未来一年有何期待?

Aravind: 这两个数字都将增长 10 倍。

David: 太好了。非常感谢你,这真是一次鼓舞人心的对话。我希望你能实现 10 倍的增长,我相信你一定能做到。感谢你的参与。

Aravind: 谢谢。