Aravind Srinivas：Perplexity 打造智能体搜索的竞速之路

摘要

本文整理自 Y Combinator 对 Perplexity AI 联合创始人兼 CEO Aravind Srinivas 的深度访谈。Aravind 回顾了 Perplexity 从研究生项目到全球知名 AI 搜索引擎的创业历程：最初以自然语言 SQL 搜索 Twitter 数据起步，逐步演变为面向全网的知识问答引擎。他详细阐述了 Perplexity 面对谷歌（Google）和 OpenAI 等巨头的竞争策略——唯一的护城河是速度，必须以马拉松的速度冲刺。访谈的核心焦点是 Perplexity 即将推出的浏览器产品 Comet，它被定位为"认知操作系统"（Cognitive Operating System），将 AI 助手、导航和智能体（Agent）融合于一个全能输入框中，让每个标签页成为独立的异步任务进程。Aravind 还深入探讨了创新者困境（Innovator's Dilemma）如何给初创公司留出机会、订阅制与按使用量计费（Usage-based Pricing）的商业模式、AI 编程工具对工程团队的影响、品牌与叙事的持久价值、幻觉（Hallucination）问题的应对策略，以及如何面对失败永不放弃的创业精神。整场对话既有战略高度，又有产品细节，为 AI 时代的创业者提供了宝贵的一手洞见。

速度是唯一的护城河

Aravind 开场即直言：面对资金雄厚的巨头竞争，Perplexity 唯一的护城河（Moat）就是速度。你必须创新，必须比所有人都跑得更快——就像以极高配速跑马拉松一样。他提到自己每次都会阅读推特（Twitter）上的评论：去年谷歌 I/O 大会发布了 AI Overview，评论说"Perplexity 要死了"；今年又发布 AI Mode，同样的论调再度出现。他坦言自己乐在其中，因为这些评论恰恰证明了 Perplexity 做的事值得被关注和效仿。

Perplexity 的现状与浏览器战略

当被问及 Perplexity 的近况时，Aravind 表示用户量持续增长，增长速度之快甚至让基础设施面临压力——每天都要处理基础设施问题，不得不为下一个十倍增长重建底层架构。他将公司的下一步重点明确定位为浏览器。面对"为什么要用 Perplexity 而不是其他搜索和 AI 应用"的质疑，他承认 ChatGPT 的分发规模更大，其他 AI 应用也在加入搜索功能和引用支持，但浏览器和智能体（Agent）才是 Perplexity 真正的下一个赌注。

他设想的浏览器并非完全自主的代理，而是一个助手（Assistant）：一个全能输入框（Omni Box），用户可以在其中导航网页、发起信息查询、指派智能体任务。AI 伴随你的新标签页，在你访问的任何网页上作为助手出现，使浏览器更像一个认知操作系统而非又一个浏览器。他进一步设想：浏览器运行在云端，用户可以同时启动多个并行异步任务，这些任务可以拉取个人通讯录、邮件、日历、亚马逊（Amazon）订单、社交媒体账户，并进行房地产调研、市场分析等——所有这些都是运行在浏览器上的进程，这在过去从未成为可能。

正如当年 Chrome 令人兴奋之处在于每个标签页都是独立进程，Perplexity 的浏览器 Comet 将让每个查询或提示词（Prompt）成为一个独立进程，公司正将全部精力投入其中。

与巨头的竞争格局

主持人指出，如果 Sam Altman 还在台上，他会说"这也是我们要做的"，而谷歌的 Sundar 也会说这是他们的方向。Aravind 回应道：如果一件事真的值得做，资金充裕的玩家自然会跟进，这是正常的。Perplexity 做出了好产品，现在所有人都在尝试做能回答任何问题并附带来源的产品；Cursor 做出了好产品，OpenAI 就试图收购其竞争对手，Anthropic 推出了 Claude Code，谷歌也有自己的竞品。

他认为关键在于：你能做到世界级的领域是有限的——无论是构建大模型还是做一两个好产品。对 Perplexity 而言，搜索和准确性是唯一关心的事。浏览器比又一个聊天工具难复制得多。但他也坦承，自己完全在"OpenAI 也会做自己的浏览器、Anthropic 也会尝试、谷歌已经有 Chrome"的假设下工作。唯一的模式就是速度，必须创新，必须比所有人都快。

主持人补充了一个细节：在访谈开始前，Aravind 在后台展示新功能时发现一个 Bug，他立刻停下一切来排查。如果是一家大公司的 CEO，大概率会交给团队处理——这正是 Aravind 言行一致的证据。Aravind 笑称自己热爱排查和修复 Bug，虽然这听起来微不足道，也不一定是 CEO 时间的最佳用途，但他注意到这种行为正在产生示范效应——甚至连 Sundar 都开始在 X 平台上做 Bug 支持了。

从研究生到创业者：Perplexity 的起源

Aravind 回忆了创立 Perplexity 的过程。与 YC 建议"从一个项目开始，将其发展为公司"相反，他们在创业初期并没有清晰的产品方向。但他认为，在 AI 进步如此之快的当下，起步时不必死守一个想法——不过也不应该每周都换方向。

最初他们构建的工具是自然语言 SQL（Natural Language SQL），将其视为一种搜索关系型数据库的搜索工具。Aravind 曾使用过早期 Facebook 图谱搜索（Graph Search），一直想用语言模型重建类似体验。他热爱推特平台，而推特一直没有好的搜索方式——至今仍然如此。他们将推特的全部数据整理为关系表的形式，将用户的自然语言查询转化为 SQL 查询并在数据库上运行，效果非常好。

但随后他们意识到，这种方式无法扩展到整个互联网——不可能把所有网站都变成表格形式，也不容易回答所有类型的问题。于是他们押注语言模型（Language Model）能够完成所有推理、解析和结构化工作，从更非结构化的方式开始——这最终成为了 Perplexity。

联合创始人与研究生价值

关于如何找到联合创始人，Aravind 直言不讳："因为 AI 是我唯一擅长的东西。"他不可能创办物流公司或社交媒体公司，他不是合适的人选。有趣的是，虽然创办了一家 AI 公司，Perplexity 初期并不训练自己的基础模型（Foundation Model），但这恰恰体现了知识分子谦逊（Intellectual Humility）——知道自己的长处、在现有资源下什么是可行的。联合创始人都是他在研究生院认识的，他们长期讨论想法。Aravind 认为研究生院是发现联合创始人的绝佳方式——你不是带着"这人可能是我未来联合创始人"的功利心去交往，而是因为对方是有趣的人才去交流。这也是 YC 网络的价值所在：即使第一次创业失败，你会结识很多优秀的人，他们可能是你未来的联合创始人。

从推特搜索到全网问答的关键跃迁

Perplexity 早期版本面向推特、LinkedIn、GitHub 的关系型数据库搜索，获得早期用户的持续使用。Aravind 观察到产品中存在一种现象：初始惊叹效应（Wow Factor）之后，要么使用量完全消失（意味着没有真正的留存），要么虽然下降但保持持续使用。当他们看到关系型数据库搜索有持续使用时，意识到大语言模型与搜索的结合有某种魔力。

然后他们大胆设想：如果直接给出答案并引用相关来源呢？他们将其作为 Discord 机器人发布，同样获得了持续使用——不是一天新鲜后就被遗忘。这给了他们上线的勇气。他们在 ChatGPT 发布仅七天后上线了 Perplexity，而当时 ChatGPT 还没有网络搜索功能——这是一个好时机。Aravind 指出，如今人们谈论的成功 AI 产品（包括 Cursor）大多是在 2022 年末或 2023 年初发布的，在 AI 时间尺度上，它们都已经是"老前辈"了。

新年前夜的顿悟时刻

Aravind 的"顿悟时刻"（Aha Moment）发生在新年前夜——当天查询量接近 70 万次。他想到：这个产品有着对消费级产品来说最糟糕的名字——Perplexity，没人知道怎么拼写和分享它，回答一个查询需要七秒钟，还经常产生幻觉，公司默默无闻，创始人默默无闻，种子轮只有一两百万美元。尽管如此，人们仍在新年前夜分享截图——他们本可以在看 Netflix。那一刻，Aravind 确信这里有真实的东西，并开始全力投入这个愿景。

与谷歌竞争的逻辑

当被问及是否意识到自己在建造能挑战谷歌的产品时，Aravind 回忆道：这个想法第一次浮现是在谷歌写了一篇关于 Bard 的博客文章时——那时 Perplexity 正在筹集 A 轮融资，所有人都说"Bard 会做你们正在做的事"。Aravind 反思：如果谷歌拥有世界上所有的分发渠道，为什么还要单独构建 Bard 产品，而不是直接在谷歌搜索中加入这些功能？

答案在于商业模式冲突：如果用户能直接获得"旧金山能看到金门大桥景观的最佳酒店"或"纽约中央公园附近设施完善的住处"这类问题的答案，并附带预订链接，谷歌如何从 Booking.com、Expedia、Kayak 等平台赚取广告费？购物场景同样如此——亚马逊和沃尔玛都在竞价同一广告位，谷歌没有动机给出真正好的答案。Aravind 由此意识到，谷歌必须构建单独产品，但永远无法利用其核心分发渠道。

此外，2023 年及 2024 年大部分时间里，谷歌内部的模型最多只能排到第四或第五。作为谷歌之外的初创公司，你能使用比谷歌内部更好的 AI——这在历史上是前所未有的。以前要跟谷歌竞争需要大量 AI 的领域，你在谷歌之外永远拿不到同等水平的 AI，更别说更好的了。但感谢 OpenAI、Anthropic 和开源模型，局面完全逆转了。加上创新者困境——Perplexity 可以犯错而无关紧要，但谷歌一个错误就可能让股价暴跌——Bard 直播演示失败时股价跌了 6%。这些优势叠加，给了 Perplexity 竞争的信心。

谷歌为何失去了产品感觉

Aravind 坦言，谷歌有非常优秀的人才，没有人会认为谷歌有无能的员工。问题主要出在激励机制结构上——很难主动承受股价打击去做长期正确的事。他坦言自己其实很高兴这种困境存在，否则初创公司哪有入场机会？如果初创公司无法成功，垄断只会越来越大，这对世界并不好。他很高兴 Perplexity 能够赢，谷歌也在推出新产品，人们第一次开始比较——以前获取信息时，从来不会费心去比较谷歌的替代品，现在至少会先问 AI 应用。

浏览器 Comet：超越聊天的抽象层

面对 ChatGPT 作为最成功的消费级 AI 产品的竞争压力，Aravind 强调他推动公司在浏览器方向上发力。Comet 浏览器将成为聊天机器人（Chatbot）之上的抽象层：如果用户允许，所有 ChatGPT 对话都可以导入 Comet 的 AI，无需担心记忆或个性化问题。更重要的是，浏览器可以做聊天机器人做不到的事：访问其他标签页、浏览历史、替用户填写表单、支付信用卡、购物、做调研、执行周期性重复任务——这就是浏览器带来的魔力。

移动端浏览器的构建在工程上非常困难，需要数月时间，所以 Aravind 并不担心别人复制。关于用户为何要切换浏览器，他表示 Perplexity 将提供 AI、导航和智能体的完美融合——听起来可能无聊，但没人做到过。如今有数亿人在使用 AI，市场已经相当大了。

具体使用场景包括：安排会议、回复不想读的邮件、筛选申请人——例如举办 YC 活动只想接受斯坦福辍学生，浏览器可以去爬取所有申请人的 LinkedIn 页面，筛选出斯坦福且辍学的候选人，然后接受——这种多步推理（Multi-step Reasoning）是独特能力。Aravind 幽默地补充说，他并不是说这是好的筛选标准，"否则我自己都进不来"。

AI 编程工具的实践与反思

Perplexity 目前约有 200 名员工。Aravind 表示公司强制要求使用至少一种 AI 编程工具，内部主要使用 Cursor 和 GitHub Copilot 的组合。前端设计领域采用率极高，机器学习人员有时会阅读论文后直接上传伪代码（Pseudo Code）截图，让 Cursor 编辑文件实现新算法、编写单元测试并运行实验，将实验周期从三四天缩短到一小时。Aravind 自己也会给不擅长设计的工程师反馈——截取 iOS 应用截图、标注按钮移动位置，工程师将截图上传给 Cursor 即可修改 Swift UI 文件，修 Bug 和上线的速度快得惊人。

但 Aravind 也坦承：这些工具在引入新 Bug，很多人不知道如何修复，甚至不知道 Bug 是怎么产生的。Claude Code 在他看来比 Cursor 更智能，他对此持乐观态度，但目前确实存在问题。对于"AI 编程工具越来越强，公司的持久价值何在"的疑问，他强调品牌具有巨大价值——OpenAI 的 ChatGPT 内置了类 Perplexity 功能，Cursor 的竞争对手被收购，但这些公司都没有因此消亡。一旦你获得数百万付费用户的规模，你就赢得了继续构建的权利。品牌之外，叙事（Narrative）同样关键——必须向用户传达你为何需要存在。对 Perplexity 而言，就是对准确性的专注：即使有一百个聊天机器人，我们是最专注于给出正确答案的；对速度的专注——首令牌时间（Time to First Token）在应用和网页端最快；对答案呈现方式的专注。这些执念构成了叙事和品牌身份。

网络效应与浏览器锁定

关于网络效应（Network Effect），Aravind 坦言目前没有 AI 产品拥有应用内网络效应——不像 WhatsApp，即使 Meta 品牌存疑，也没人能轻易切换，因为所有联系人和群组都在那里。AI 产品目前缺乏这种粘性，聊天记录可以轻松导出。但他认为浏览器将是一个突破口——浏览历史、密码、钱包、记住你的智能体、日常依赖的任务——这些比 CSV 导出难以替代得多。如果多人依赖同一组共享任务，就能创造网络效应。

合作伙伴生态与 MCP 策略

Perplexity 已经建立了广泛的合作伙伴生态：与 Sabre 合作处理酒店预订，与 Tripadvisor 整合酒店评论，与 Yelp 合作本地信息，与 Shopify 合作购物，与 Firmly 支持购买，与 FMP 合作金融数据，与 Stats Perform 合作体育数据。Aravind 指出，随着智能体开始执行任务，这种合作将进一步扩展。一些第三方愿意成为 MCP 服务器（MCP Server），一些则想保护自己的网站。

Comet 浏览器的智能体将足够通用，能尊重第三方的意愿——因为最终是用户授权智能体代为操作。即使没有 MCP 服务器也没关系，智能体可以像人类一样使用标签页操作网站。这是完全依赖 MCP 愿景的关键优势：如果完全依赖 MCP，你需要第三方 MCP 服务器可靠运行、通过 MCP 协议发送的数据完美无缺、聊天机器人处理所有问题；而从底层设计成人类使用网站的方式，你就能完全掌控操作流程，不需要依赖别人做好工程。

商业模式：订阅、按量计费与交易分成

Aravind 坦言 Perplexity 可能永远不会达到谷歌的利润量级——历史上甚至谷歌自己也没有第二个业务能达到那样的利润率。但远超任何现有上市公司的同时仍远低于谷歌，这是完全合理的。

订阅收入（Subscription Revenue）令人鼓舞，超出了预期，Aravind 认为仅订阅每年就能增长到数十亿美元的规模。按使用量计费（Usage-based Pricing）——用户为智能体完成任务付费、为周期性任务按次付费，并以雇佣人工完成同样任务的成本为参照——也将成为现实。但具体如何演变、利润率如何，目前还不确定。按使用量计费的用户量可能远超订阅，但利润率可能更低，因为每次查询都有成本。而订阅用户可能一整个月都不使用，利润率反而更高。交易分成（Transaction Cut）方面，如果用户越来越多地通过 AI 购物，从中抽取佣金是可行的，但按行动付费（CPA）的历史利润率远低于按点击付费（CPC），这也是谷歌从未成为交易平台的原因。所以 Perplexity 会赚很多钱，但可能永远达不到谷歌的量级。

给创业者的建议

Aravind 给在场的学生和创业者三条核心建议：

第一，拼命工作，没有替代方案。不要自以为很聪明就能巧妙地构建公司——尽管大模型实验室在做各种事，你仍要假设如果你的产品能产生数亿甚至数十亿美元的收入，模型公司一定会复制它。他们筹集了数百亿美元，需要证明资本开支的合理性，所以会复制一切好东西。

第二，拥抱这种恐惧。你的护城河来自快速行动和围绕所做的事建立自己的身份。用户最终在乎的是专注——就像你找家政服务时找的是特定的人，而不是一家包揽一切的中介。

第三，带着恐惧入睡，带着恐惧醒来，但每天仍对即将构建的东西感到兴奋——因为只有这样才能坚持下去。

观众问答

关于幻觉与准确性

一位观众问到作为主流搜索引擎预装到三星手机上的责任，以及如何防止幻觉（Hallucination）。Aravind 表示 Perplexity 非常重视幻觉问题，正在内部构建基准测试（Benchmark）来跟踪进展。唯一的解决路径是持续构建更好的搜索索引、捕获更好的网页片段，并利用越来越快的模型对每个查询进行多步推理（Multistep Reasoning）——在成本不过高的前提下，这是减少幻觉的另一条路径。

如果你是谷歌

一位观众问到创新者困境的反面——如果 Aravind 处于 Sundar 或谷歌联合创始人的位置，会怎么做？Aravind 坦言他完全不羡慕那个职位，那是世界上最困难的工作之一。是否要牺牲商业模式来获取下一个产品？是否要构建单独产品来竞争 Perplexity 但牺牲分发优势？他真心不知道。他指出世界上有很多人讨厌 AI，在如此庞大的分发渠道上强行推送 AI 并不容易。如果广告成为每个 AI 回答的一部分，用户也会讨厌。所以有 Perplexity 这样的替代方案是好事。

关于 Nithin Kamath 的实习

一位观众提到 Nithin Kamat（印度 Zerodha 创始人）曾在访谈中向 Aravind 请求实习。Aravind 确认 Nithin 来了办公室待了几天，虽然没有正式实习，但确实进行了深入交流。

面对基础模型整合的威胁

一位观众指出很多初创公司发现基础模型（Foundation Model）的好应用后，模型公司会将其整合到自己的基础设施中——ChatGPT、Gemini、Cohere 都加入了搜索功能。Aravind 的建议是：选择你想被认知的领域。虽然其他人在整合搜索，但 Perplexity 仍要是最快、最准确的。同时必须制定新策略、构建尚不存在的新产品——浏览器就是 Perplexity 的赌注。浏览器和搜索不是两个独立产品，浏览器是搜索的自然进阶，正如谷歌从搜索进阶到 Chrome——Chrome 正是谷歌从数亿日查询增长到百亿日查询的关键原因。谷歌 IPO 时还没有浏览器，只有约一亿次查询。浏览器是实现这一切的重要一环，而智能体只能通过浏览器来构建——如果想要一个不受操作系统规则限制的移动智能体，指望每个移动应用都提供 MCP 服务器并连接数据是不现实的，没人愿意那么快被 AI 去中介化（Disintermediated）。

面对失败如何坚持

一位观众问在反复失败的时刻如何坚持下去。Aravind 的回答出人意料地简单："我看 Elon Musk 的 YouTube 视频。"（全场笑声和掌声）他随后认真补充道，有一个视频是连续第三次失败后，有人问马斯克怎么想，他说"我永远不会放弃，除非我死了或者丧失能力"。Aravind 表示他希望自己也能如此——这并不容易，马斯克坚持的时间更长，这也是为什么大家尊敬他。但确实有伟大的企业家在所有困难面前做到了这一点，所以你有什么可失去的？继续前进就好。

网页生态的未来

一位观众指出研究表明 AI 搜索引擎给网站带来的流量大幅减少，5 到 10 年后网页会变成什么样？Aravind 认为网页本身已经是长尾分布，存在巨大的幂律分布（Power Law），而这一趋势将更加倾斜。知名品牌会保持直接的有机访问，但那些试图操纵 SEO 系统来获取流量的网站将面临更艰难的处境。

摘要与抄袭的界限、政治偏见

一位观众问了两个问题：摘要生成与抄袭之间的界限如何界定，以及如何处理政治偏见。Aravind 区分了两类情况：对于有客观事实的问题（如 NBA 比赛比分、旧金山实时天气），Perplexity 绝不能出错。这依赖于信任——信任追踪比赛的数据提供商、显示数字的电视、Apple 或 Google 的天气应用。信任建立在长期准确可靠的基础上，所以 Perplexity 的做法是从赢得展示权的正确来源中呈现正确数据。

对于没有唯一准确答案的问题，最好的做法是提供所有视角（Perspective），不在对错上表明明确立场。当被问及如何衡量这种准确性时，Aravind 承认目前没有测量，应该为此构建评估集（Eval Set），但构建自动化评估的难题在于"什么才是正确答案"本身就是主观的。依赖维基百科（Wikipedia）作为来源对于人工评估者来说可能是好答案，但也许用户想要的是维基百科上没有的内容，这需要更优秀的人工评估者——不是 Scale AI 风格的评估，而是更聪明的人来评判。

市场推广策略

最后一位观众问到 Perplexity 的市场推广（Go-to-market）策略——既有面向学生的成功推广活动，也有与好市多（Costco）这样面向不同受众的合作。Aravind 解释道，核心思路是进入传统营销渠道无法触及的用户分发渠道。很多人不用推特或领英，他们生活在我们的信息茧房之外。像经常使用 Costco 的人可能根本不常用 AI——如果要触达这类人群，就需要调整策略。但同时要记住：与邻近市场一起增长是好的，你需要一些重叠的用户群体作为口碑传播者，帮助他们将产品扩展到更多不重叠的圈子。分发策略应该随时间不断演进。

结语

这场访谈展现了 Aravind Srinivas 作为创业者的清晰思路和坚定信念。从研究生院的一个 SQL 搜索工具到挑战谷歌的 AI 搜索引擎，再到押注浏览器和智能体的未来，Perplexity 的每一步都印证了 Aravind 的核心信条：速度是唯一的护城河，拥抱恐惧，永不放弃。在 AI 重塑一切的时代，这既是一家公司的故事，也是所有创业者的镜鉴。