Aravind Srinivas:Perplexity 打造智能体搜索的竞速之路

摘要
本文整理自 Y Combinator 对 Perplexity AI 联合创始人兼 CEO Aravind Srinivas 的深度访谈。Aravind 回顾了 Perplexity 从研究生项目到全球知名 AI 搜索引擎的创业历程:最初以自然语言 SQL 搜索 Twitter 数据起步,逐步演变为面向全网的知识问答引擎。他详细阐述了 Perplexity 面对谷歌(Google)和 OpenAI 等巨头的竞争策略——唯一的护城河是速度,必须以马拉松的速度冲刺。访谈的核心焦点是 Perplexity 即将推出的浏览器产品 Comet,它被定位为"认知操作系统"(Cognitive Operating System),将 AI 助手、导航和智能体(Agent)融合于一个全能输入框中,让每个标签页成为独立的异步任务进程。Aravind 还深入探讨了创新者困境(Innovator's Dilemma)如何给初创公司留出机会、订阅制与按使用量计费(Usage-based Pricing)的商业模式、AI 编程工具对工程团队的影响、品牌与叙事的持久价值、幻觉(Hallucination)问题的应对策略,以及如何面对失败永不放弃的创业精神。整场对话既有战略高度,又有产品细节,为 AI 时代的创业者提供了宝贵的一手洞见。
速度是唯一的护城河
Aravind 开场即直言:面对资金雄厚的巨头竞争,Perplexity 唯一的护城河(Moat)就是速度。你必须创新,必须比所有人都跑得更快——就像以极高配速跑马拉松一样。他提到自己每次都会阅读推特(Twitter)上的评论:去年谷歌 I/O 大会发布了 AI Overview,评论说"Perplexity 要死了";今年又发布 AI Mode,同样的论调再度出现。他坦言自己乐在其中,因为这些评论恰恰证明了 Perplexity 做的事值得被关注和效仿。
Perplexity 的现状与浏览器战略
当被问及 Perplexity 的近况时,Aravind 表示用户量持续增长,增长速度之快甚至让基础设施面临压力——每天都要处理基础设施问题,不得不为下一个十倍增长重建底层架构。他将公司的下一步重点明确定位为浏览器。面对"为什么要用 Perplexity 而不是其他搜索和 AI 应用"的质疑,他承认 ChatGPT 的分发规模更大,其他 AI 应用也在加入搜索功能和引用支持,但浏览器和智能体(Agent)才是 Perplexity 真正的下一个赌注。
他设想的浏览器并非完全自主的代理,而是一个助手(Assistant):一个全能输入框(Omni Box),用户可以在其中导航网页、发起信息查询、指派智能体任务。AI 伴随你的新标签页,在你访问的任何网页上作为助手出现,使浏览器更像一个认知操作系统而非又一个浏览器。他进一步设想:浏览器运行在云端,用户可以同时启动多个并行异步任务,这些任务可以拉取个人通讯录、邮件、日历、亚马逊(Amazon)订单、社交媒体账户,并进行房地产调研、市场分析等——所有这些都是运行在浏览器上的进程,这在过去从未成为可能。
正如当年 Chrome 令人兴奋之处在于每个标签页都是独立进程,Perplexity 的浏览器 Comet 将让每个查询或提示词(Prompt)成为一个独立进程,公司正将全部精力投入其中。
与巨头的竞争格局
主持人指出,如果 Sam Altman 还在台上,他会说"这也是我们要做的",而谷歌的 Sundar 也会说这是他们的方向。Aravind 回应道:如果一件事真的值得做,资金充裕的玩家自然会跟进,这是正常的。Perplexity 做出了好产品,现在所有人都在尝试做能回答任何问题并附带来源的产品;Cursor 做出了好产品,OpenAI 就试图收购其竞争对手,Anthropic 推出了 Claude Code,谷歌也有自己的竞品。
他认为关键在于:你能做到世界级的领域是有限的——无论是构建大模型还是做一两个好产品。对 Perplexity 而言,搜索和准确性是唯一关心的事。浏览器比又一个聊天工具难复制得多。但他也坦承,自己完全在"OpenAI 也会做自己的浏览器、Anthropic 也会尝试、谷歌已经有 Chrome"的假设下工作。唯一的模式就是速度,必须创新,必须比所有人都快。
主持人补充了一个细节:在访谈开始前,Aravind 在后台展示新功能时发现一个 Bug,他立刻停下一切来排查。如果是一家大公司的 CEO,大概率会交给团队处理——这正是 Aravind 言行一致的证据。Aravind 笑称自己热爱排查和修复 Bug,虽然这听起来微不足道,也不一定是 CEO 时间的最佳用途,但他注意到这种行为正在产生示范效应——甚至连 Sundar 都开始在 X 平台上做 Bug 支持了。
从研究生到创业者:Perplexity 的起源
Aravind 回忆了创立 Perplexity 的过程。与 YC 建议"从一个项目开始,将其发展为公司"相反,他们在创业初期并没有清晰的产品方向。但他认为,在 AI 进步如此之快的当下,起步时不必死守一个想法——不过也不应该每周都换方向。
最初他们构建的工具是自然语言 SQL(Natural Language SQL),将其视为一种搜索关系型数据库的搜索工具。Aravind 曾使用过早期 Facebook 图谱搜索(Graph Search),一直想用语言模型重建类似体验。他热爱推特平台,而推特一直没有好的搜索方式——至今仍然如此。他们将推特的全部数据整理为关系表的形式,将用户的自然语言查询转化为 SQL 查询并在数据库上运行,效果非常好。
但随后他们意识到,这种方式无法扩展到整个互联网——不可能把所有网站都变成表格形式,也不容易回答所有类型的问题。于是他们押注语言模型(Language Model)能够完成所有推理、解析和结构化工作,从更非结构化的方式开始——这最终成为了 Perplexity。
联合创始人与研究生价值
关于如何找到联合创始人,Aravind 直言不讳:"因为 AI 是我唯一擅长的东西。"他不可能创办物流公司或社交媒体公司,他不是合适的人选。有趣的是,虽然创办了一家 AI 公司,Perplexity 初期并不训练自己的基础模型(Foundation Model),但这恰恰体现了知识分子谦逊(Intellectual Humility)——知道自己的长处、在现有资源下什么是可行的。联合创始人都是他在研究生院认识的,他们长期讨论想法。Aravind 认为研究生院是发现联合创始人的绝佳方式——你不是带着"这人可能是我未来联合创始人"的功利心去交往,而是因为对方是有趣的人才去交流。这也是 YC 网络的价值所在:即使第一次创业失败,你会结识很多优秀的人,他们可能是你未来的联合创始人。
从推特搜索到全网问答的关键跃迁
Perplexity 早期版本面向推特、LinkedIn、GitHub 的关系型数据库搜索,获得早期用户的持续使用。Aravind 观察到产品中存在一种现象:初始惊叹效应(Wow Factor)之后,要么使用量完全消失(意味着没有真正的留存),要么虽然下降但保持持续使用。当他们看到关系型数据库搜索有持续使用时,意识到大语言模型与搜索的结合有某种魔力。
然后他们大胆设想:如果直接给出答案并引用相关来源呢?他们将其作为 Discord 机器人发布,同样获得了持续使用——不是一天新鲜后就被遗忘。这给了他们上线的勇气。他们在 ChatGPT 发布仅七天后上线了 Perplexity,而当时 ChatGPT 还没有网络搜索功能——这是一个好时机。Aravind 指出,如今人们谈论的成功 AI 产品(包括 Cursor)大多是在 2022 年末或 2023 年初发布的,在 AI 时间尺度上,它们都已经是"老前辈"了。
新年前夜的顿悟时刻
Aravind 的"顿悟时刻"(Aha Moment)发生在新年前夜——当天查询量接近 70 万次。他想到:这个产品有着对消费级产品来说最糟糕的名字——Perplexity,没人知道怎么拼写和分享它,回答一个查询需要七秒钟,还经常产生幻觉,公司默默无闻,创始人默默无闻,种子轮只有一两百万美元。尽管如此,人们仍在新年前夜分享截图——他们本可以在看 Netflix。那一刻,Aravind 确信这里有真实的东西,并开始全力投入这个愿景。
与谷歌竞争的逻辑
当被问及是否意识到自己在建造能挑战谷歌的产品时,Aravind 回忆道:这个想法第一次浮现是在谷歌写了一篇关于 Bard 的博客文章时——那时 Perplexity 正在筹集 A 轮融资,所有人都说"Bard 会做你们正在做的事"。Aravind 反思:如果谷歌拥有世界上所有的分发渠道,为什么还要单独构建 Bard 产品,而不是直接在谷歌搜索中加入这些功能?
答案在于商业模式冲突:如果用户能直接获得"旧金山能看到金门大桥景观的最佳酒店"或"纽约中央公园附近设施完善的住处"这类问题的答案,并附带预订链接,谷歌如何从 Booking.com、Expedia、Kayak 等平台赚取广告费?购物场景同样如此——亚马逊和沃尔玛都在竞价同一广告位,谷歌没有动机给出真正好的答案。Aravind 由此意识到,谷歌必须构建单独产品,但永远无法利用其核心分发渠道。
此外,2023 年及 2024 年大部分时间里,谷歌内部的模型最多只能排到第四或第五。作为谷歌之外的初创公司,你能使用比谷歌内部更好的 AI——这在历史上是前所未有的。以前要跟谷歌竞争需要大量 AI 的领域,你在谷歌之外永远拿不到同等水平的 AI,更别说更好的了。但感谢 OpenAI、Anthropic 和开源模型,局面完全逆转了。加上创新者困境——Perplexity 可以犯错而无关紧要,但谷歌一个错误就可能让股价暴跌——Bard 直播演示失败时股价跌了 6%。这些优势叠加,给了 Perplexity 竞争的信心。
谷歌为何失去了产品感觉
Aravind 坦言,谷歌有非常优秀的人才,没有人会认为谷歌有无能的员工。问题主要出在激励机制结构上——很难主动承受股价打击去做长期正确的事。他坦言自己其实很高兴这种困境存在,否则初创公司哪有入场机会?如果初创公司无法成功,垄断只会越来越大,这对世界并不好。他很高兴 Perplexity 能够赢,谷歌也在推出新产品,人们第一次开始比较——以前获取信息时,从来不会费心去比较谷歌的替代品,现在至少会先问 AI 应用。
浏览器 Comet:超越聊天的抽象层
面对 ChatGPT 作为最成功的消费级 AI 产品的竞争压力,Aravind 强调他推动公司在浏览器方向上发力。Comet 浏览器将成为聊天机器人(Chatbot)之上的抽象层:如果用户允许,所有 ChatGPT 对话都可以导入 Comet 的 AI,无需担心记忆或个性化问题。更重要的是,浏览器可以做聊天机器人做不到的事:访问其他标签页、浏览历史、替用户填写表单、支付信用卡、购物、做调研、执行周期性重复任务——这就是浏览器带来的魔力。
移动端浏览器的构建在工程上非常困难,需要数月时间,所以 Aravind 并不担心别人复制。关于用户为何要切换浏览器,他表示 Perplexity 将提供 AI、导航和智能体的完美融合——听起来可能无聊,但没人做到过。如今有数亿人在使用 AI,市场已经相当大了。
具体使用场景包括:安排会议、回复不想读的邮件、筛选申请人——例如举办 YC 活动只想接受斯坦福辍学生,浏览器可以去爬取所有申请人的 LinkedIn 页面,筛选出斯坦福且辍学的候选人,然后接受——这种多步推理(Multi-step Reasoning)是独特能力。Aravind 幽默地补充说,他并不是说这是好的筛选标准,"否则我自己都进不来"。
AI 编程工具的实践与反思
Perplexity 目前约有 200 名员工。Aravind 表示公司强制要求使用至少一种 AI 编程工具,内部主要使用 Cursor 和 GitHub Copilot 的组合。前端设计领域采用率极高,机器学习人员有时会阅读论文后直接上传伪代码(Pseudo Code)截图,让 Cursor 编辑文件实现新算法、编写单元测试并运行实验,将实验周期从三四天缩短到一小时。Aravind 自己也会给不擅长设计的工程师反馈——截取 iOS 应用截图、标注按钮移动位置,工程师将截图上传给 Cursor 即可修改 Swift UI 文件,修 Bug 和上线的速度快得惊人。
但 Aravind 也坦承:这些工具在引入新 Bug,很多人不知道如何修复,甚至不知道 Bug 是怎么产生的。Claude Code 在他看来比 Cursor 更智能,他对此持乐观态度,但目前确实存在问题。对于"AI 编程工具越来越强,公司的持久价值何在"的疑问,他强调品牌具有巨大价值——OpenAI 的 ChatGPT 内置了类 Perplexity 功能,Cursor 的竞争对手被收购,但这些公司都没有因此消亡。一旦你获得数百万付费用户的规模,你就赢得了继续构建的权利。品牌之外,叙事(Narrative)同样关键——必须向用户传达你为何需要存在。对 Perplexity 而言,就是对准确性的专注:即使有一百个聊天机器人,我们是最专注于给出正确答案的;对速度的专注——首令牌时间(Time to First Token)在应用和网页端最快;对答案呈现方式的专注。这些执念构成了叙事和品牌身份。
网络效应与浏览器锁定
关于网络效应(Network Effect),Aravind 坦言目前没有 AI 产品拥有应用内网络效应——不像 WhatsApp,即使 Meta 品牌存疑,也没人能轻易切换,因为所有联系人和群组都在那里。AI 产品目前缺乏这种粘性,聊天记录可以轻松导出。但他认为浏览器将是一个突破口——浏览历史、密码、钱包、记住你的智能体、日常依赖的任务——这些比 CSV 导出难以替代得多。如果多人依赖同一组共享任务,就能创造网络效应。
合作伙伴生态与 MCP 策略
Perplexity 已经建立了广泛的合作伙伴生态:与 Sabre 合作处理酒店预订,与 Tripadvisor 整合酒店评论,与 Yelp 合作本地信息,与 Shopify 合作购物,与 Firmly 支持购买,与 FMP 合作金融数据,与 Stats Perform 合作体育数据。Aravind 指出,随着智能体开始执行任务,这种合作将进一步扩展。一些第三方愿意成为 MCP 服务器(MCP Server),一些则想保护自己的网站。
Comet 浏览器的智能体将足够通用,能尊重第三方的意愿——因为最终是用户授权智能体代为操作。即使没有 MCP 服务器也没关系,智能体可以像人类一样使用标签页操作网站。这是完全依赖 MCP 愿景的关键优势:如果完全依赖 MCP,你需要第三方 MCP 服务器可靠运行、通过 MCP 协议发送的数据完美无缺、聊天机器人处理所有问题;而从底层设计成人类使用网站的方式,你就能完全掌控操作流程,不需要依赖别人做好工程。
商业模式:订阅、按量计费与交易分成
Aravind 坦言 Perplexity 可能永远不会达到谷歌的利润量级——历史上甚至谷歌自己也没有第二个业务能达到那样的利润率。但远超任何现有上市公司的同时仍远低于谷歌,这是完全合理的。
订阅收入(Subscription Revenue)令人鼓舞,超出了预期,Aravind 认为仅订阅每年就能增长到数十亿美元的规模。按使用量计费(Usage-based Pricing)——用户为智能体完成任务付费、为周期性任务按次付费,并以雇佣人工完成同样任务的成本为参照——也将成为现实。但具体如何演变、利润率如何,目前还不确定。按使用量计费的用户量可能远超订阅,但利润率可能更低,因为每次查询都有成本。而订阅用户可能一整个月都不使用,利润率反而更高。交易分成(Transaction Cut)方面,如果用户越来越多地通过 AI 购物,从中抽取佣金是可行的,但按行动付费(CPA)的历史利润率远低于按点击付费(CPC),这也是谷歌从未成为交易平台的原因。所以 Perplexity 会赚很多钱,但可能永远达不到谷歌的量级。
给创业者的建议
Aravind 给在场的学生和创业者三条核心建议:
第一,拼命工作,没有替代方案。不要自以为很聪明就能巧妙地构建公司——尽管大模型实验室在做各种事,你仍要假设如果你的产品能产生数亿甚至数十亿美元的收入,模型公司一定会复制它。他们筹集了数百亿美元,需要证明资本开支的合理性,所以会复制一切好东西。
第二,拥抱这种恐惧。你的护城河来自快速行动和围绕所做的事建立自己的身份。用户最终在乎的是专注——就像你找家政服务时找的是特定的人,而不是一家包揽一切的中介。
第三,带着恐惧入睡,带着恐惧醒来,但每天仍对即将构建的东西感到兴奋——因为只有这样才能坚持下去。
观众问答
关于幻觉与准确性
一位观众问到作为主流搜索引擎预装到三星手机上的责任,以及如何防止幻觉(Hallucination)。Aravind 表示 Perplexity 非常重视幻觉问题,正在内部构建基准测试(Benchmark)来跟踪进展。唯一的解决路径是持续构建更好的搜索索引、捕获更好的网页片段,并利用越来越快的模型对每个查询进行多步推理(Multistep Reasoning)——在成本不过高的前提下,这是减少幻觉的另一条路径。
如果你是谷歌
一位观众问到创新者困境的反面——如果 Aravind 处于 Sundar 或谷歌联合创始人的位置,会怎么做?Aravind 坦言他完全不羡慕那个职位,那是世界上最困难的工作之一。是否要牺牲商业模式来获取下一个产品?是否要构建单独产品来竞争 Perplexity 但牺牲分发优势?他真心不知道。他指出世界上有很多人讨厌 AI,在如此庞大的分发渠道上强行推送 AI 并不容易。如果广告成为每个 AI 回答的一部分,用户也会讨厌。所以有 Perplexity 这样的替代方案是好事。
关于 Nithin Kamath 的实习
一位观众提到 Nithin Kamat(印度 Zerodha 创始人)曾在访谈中向 Aravind 请求实习。Aravind 确认 Nithin 来了办公室待了几天,虽然没有正式实习,但确实进行了深入交流。
面对基础模型整合的威胁
一位观众指出很多初创公司发现基础模型(Foundation Model)的好应用后,模型公司会将其整合到自己的基础设施中——ChatGPT、Gemini、Cohere 都加入了搜索功能。Aravind 的建议是:选择你想被认知的领域。虽然其他人在整合搜索,但 Perplexity 仍要是最快、最准确的。同时必须制定新策略、构建尚不存在的新产品——浏览器就是 Perplexity 的赌注。浏览器和搜索不是两个独立产品,浏览器是搜索的自然进阶,正如谷歌从搜索进阶到 Chrome——Chrome 正是谷歌从数亿日查询增长到百亿日查询的关键原因。谷歌 IPO 时还没有浏览器,只有约一亿次查询。浏览器是实现这一切的重要一环,而智能体只能通过浏览器来构建——如果想要一个不受操作系统规则限制的移动智能体,指望每个移动应用都提供 MCP 服务器并连接数据是不现实的,没人愿意那么快被 AI 去中介化(Disintermediated)。
面对失败如何坚持
一位观众问在反复失败的时刻如何坚持下去。Aravind 的回答出人意料地简单:"我看 Elon Musk 的 YouTube 视频。"(全场笑声和掌声)他随后认真补充道,有一个视频是连续第三次失败后,有人问马斯克怎么想,他说"我永远不会放弃,除非我死了或者丧失能力"。Aravind 表示他希望自己也能如此——这并不容易,马斯克坚持的时间更长,这也是为什么大家尊敬他。但确实有伟大的企业家在所有困难面前做到了这一点,所以你有什么可失去的?继续前进就好。
网页生态的未来
一位观众指出研究表明 AI 搜索引擎给网站带来的流量大幅减少,5 到 10 年后网页会变成什么样?Aravind 认为网页本身已经是长尾分布,存在巨大的幂律分布(Power Law),而这一趋势将更加倾斜。知名品牌会保持直接的有机访问,但那些试图操纵 SEO 系统来获取流量的网站将面临更艰难的处境。
摘要与抄袭的界限、政治偏见
一位观众问了两个问题:摘要生成与抄袭之间的界限如何界定,以及如何处理政治偏见。Aravind 区分了两类情况:对于有客观事实的问题(如 NBA 比赛比分、旧金山实时天气),Perplexity 绝不能出错。这依赖于信任——信任追踪比赛的数据提供商、显示数字的电视、Apple 或 Google 的天气应用。信任建立在长期准确可靠的基础上,所以 Perplexity 的做法是从赢得展示权的正确来源中呈现正确数据。
对于没有唯一准确答案的问题,最好的做法是提供所有视角(Perspective),不在对错上表明明确立场。当被问及如何衡量这种准确性时,Aravind 承认目前没有测量,应该为此构建评估集(Eval Set),但构建自动化评估的难题在于"什么才是正确答案"本身就是主观的。依赖维基百科(Wikipedia)作为来源对于人工评估者来说可能是好答案,但也许用户想要的是维基百科上没有的内容,这需要更优秀的人工评估者——不是 Scale AI 风格的评估,而是更聪明的人来评判。
市场推广策略
最后一位观众问到 Perplexity 的市场推广(Go-to-market)策略——既有面向学生的成功推广活动,也有与好市多(Costco)这样面向不同受众的合作。Aravind 解释道,核心思路是进入传统营销渠道无法触及的用户分发渠道。很多人不用推特或领英,他们生活在我们的信息茧房之外。像经常使用 Costco 的人可能根本不常用 AI——如果要触达这类人群,就需要调整策略。但同时要记住:与邻近市场一起增长是好的,你需要一些重叠的用户群体作为口碑传播者,帮助他们将产品扩展到更多不重叠的圈子。分发策略应该随时间不断演进。
结语
这场访谈展现了 Aravind Srinivas 作为创业者的清晰思路和坚定信念。从研究生院的一个 SQL 搜索工具到挑战谷歌的 AI 搜索引擎,再到押注浏览器和智能体的未来,Perplexity 的每一步都印证了 Aravind 的核心信条:速度是唯一的护城河,拥抱恐惧,永不放弃。在 AI 重塑一切的时代,这既是一家公司的故事,也是所有创业者的镜鉴。