如何构建未来:Aravind Srinivas

摘要
本期"How to Build the Future"节目专访 Perplexity AI 联合创始人兼 CEO Aravind Srinivas,讲述这家公司在不到三年内成长为超过90亿美元估值的全过程。Srinivas 从印度本科来到 UC Berkeley 攻读博士,在 OpenAI 实习期间被 Ilya Sutskever 一语点醒——"唯一重要的是无监督学习 (Unsupervised Learning) 中的强化学习 (Reinforcement Learning),这就是 AGI,其他研究都不重要",从此转向生成式 AI。他受前 YC 合伙人 Daniel Gross 关于"如何构建下一个 Google"的文章启发,在尝试了企业级数据库搜索产品后,偶然发现通用的网络问答才是正确方向。Perplexity 的核心策略是"笨方法"——用简单的启发式搜索 + LLM 摘要取代复杂的智能体架构,赌注押在模型会持续变好上。从 Twitter 搜索到通用问答,从被微软 Bing Chat 的发布惊吓到找到自己的差异化,Srinivas 分享了 Perplexity 对用户体验的极致追求、每日查询量作为北极星指标、与 Google 在商业模式上的根本性创新博弈,以及他为何坚信对用户的执念和产品品味是 Perplexity 对抗巨头竞争的核心优势。
正文
从印度到伯克利:AI 研究的起点
Aravind Srinivas 在印度完成本科后,来到美国在 UC Berkeley 攻读博士学位,最初专注于 AI 和深度学习 (Deep Learning) 研究。命运的转折发生在他去 OpenAI 实习时——他仍记得第一次见到 Ilya Sutskever 的那天,他带着精心准备的"花哨想法"而来。Ilya 听了5分钟后直言:"这些全都是垃圾。" 虽然很难听,但 Srinivas 从此习惯了接受正确但令人不舒服的反馈。
Ilya 随即画了两个圆——大圆标注"无监督学习 (Unsupervised Learning)",小圆在大圆内标注"强化学习 (Reinforcement Learning)",然后说:"这就是 AGI,其他研究都不重要。" 当时 OpenAI 正在研发 GPT-1(甚至还没叫这个名字)。Srinivas 回到 Berkeley 后告诉导师,他们必须转向研究无监督学习和生成式模型 (Generative Models)。此后他又在 Google 实习,期间偶然读到《In the Plex》这本书,感受到 Google 创始人曾经也只是研究生,如今自己在他们的办公室做实习生——这让他萌生了创立一家兼具深度研究和产品基因的公司的念头。
搜索与自动驾驶:两个 AI + 产品的完美交集
Srinivas 与 Ilya 讨论后得出结论:只有两个领域可以同时做 AI 研究和产品——搜索 (Search) 和自动驾驶 (Self-Driving Car)。原因在于:产品的每次使用都成为改进底层 AI 的数据点,AI 改进又让产品更好,更多用户产生更多数据——飞轮效应 (Flywheel) 由此形成。同时,问题必须在 AI 完备性路径 (AI Completeness Path) 上——即更好的 AI 持续让你的产品更好,直到 AI 被解决为止。这样你的公司随着 AI 进步而变强,而不是被别人的 AI 进步碾压。
灵感来源与早期探索
Srinivas 读到前 YC 合伙人 Daniel Gross 的一篇博客《如何构建下一个 Google》,核心观点是:通过更好的查询重构 (Query Reformulation) 可以大幅提升搜索质量——比如在查询后自动添加 "site:rottentomatoes.com" 等后缀,就能用现有 Google 排名获得好得多的结果。LLM 可以自动生成这些后缀和过滤字符串。这让 Srinivas 意识到,生成式 AI 可能是构建更好搜索引擎的路径。
他同时受到 DeepMind Android 智能体环境的启发,想构建能控制手机应用的智能体。他与后来成为 Perplexity CTO 的联合创始人 Dennis Yarats 交流——两人曾在同一天各自发表了相同的论文,Dennis 是他实验室的访问学生,他们经常头脑风暴关于构建控制 Android 环境的智能体的想法。
从企业产品到 Twitter 搜索
最初,Srinivas 向种子投资者 Elad Gil 推销的愿景是从 AR 眼镜 (Glasses) 入手颠覆 Google——在他看来,不与搜索栏竞争,而是直接在视觉层面提供答案。但投资者明智地建议不要做这个方向。他们转向企业级垂直数据搜索——但没人愿意给他们数据。Srinivas 四处求见 CrunchBase 等公司,希望拿到数据做演示来吸引投资,但都被拒绝。
下一个最佳选择是 Twitter——Elon 收购前的 Twitter 允许学术访问,他们构建了 Twitter 数据库,组织成表格形式,用 OpenAI Codex 模型(甚至早于 GPT-3.5)做查询:写大量 SQL 模板,模型做检索增强生成 (RAG),将查询匹配模板后生成实际 SQL,还加入了大量错误自动纠正和回调机制。这是一个聊天界面,可以对话、绘制图表——仅用一个月、三个人就做出来了。人们惊讶于前所未有的搜索体验——你可以搜索"谁关注了谁"、"谁这周取关了谁"这类社交搜索 (Social Search) 功能。
从结构化到非结构化:Perplexity 的诞生
Srinivas 读到 Polya 的一条推文:当你找到更好的解法时,尝试解决更难的版本,往往会得到更通用、更可扩展的简单解法。他意识到:一种方式是为每个领域建索引、结构化成表格、让 LLM 读取 SQL;另一种是保持非结构化 (Unstructured),让 LLM 在推理时 (Inference Time) 承担大部分工作,不在索引阶段做过多预处理。
随着模型越来越聪明,第二种方式显然是未来——它更通用,且有机会对抗 Google 建立的第一种方式的遗留系统。于是他们用了一个周末做出了原型。当时 John Schulman 的团队已经发布了 WebGPT,Srinivas 在 OpenAI 工作时就知道一个叫"Truth Bot"的内部机器人——但那用175B 参数的 GPT-3,极其缓慢,是一个 RL 智能体,会决定是否点击链接、浏览、滚动。
"笨方法"的赌注
Perplexity 采取了完全不同的策略——一个非常简单的启发式版本 (Heuristic Version),但快得多:始终取搜索 API 返回的 Top-K 链接,始终只取已缓存的摘要片段 (Summary Snippets),没有滚动、没有点击,全部喂入提示词 (Prompt),让模型以学术引用格式写出带来源的摘要。
当 3.5 Turbo 等指令跟随能力 (Instruction Following) 更强的模型出现时,这个"笨方法"开始真正奏效。Srinivas 指出,一年前如果用同样方法,模型太差根本行不通,你会得出"需要更聪明的方法"的结论。但当模型足够好时,笨方法反而解决了核心的用户体验问题——延迟 (Latency)。即使如此,第一个版本仍需7秒生成答案——因为当时还没有流式回答 (Streaming) 的概念,必须等整个答案生成完毕,甚至要硬编码提示词限制"只写5句话或80词"来保持速度。
传播与成长:从自搜索到追问
Srinivas 发布推文时就预期会遭到嘲笑——而第一次病毒式传播确实来自一位不满的学者:她搜索自己名字,Perplexity 给出了过去时态的传记——但实际上有一个同名同姓的人去世了,模型误以为她也已故。Srinivas 认为这其实是相当聪明的推理,只是缺少更高阶的区分能力。这次事件反而带来了大量关注,人们开始搜索自己——就像 Instagram 用户习惯在搜索栏输入用户名而非点击个人头像一样,这是根深蒂固的人性习惯。用户会把他们的社交账号输入 Perplexity,获得跨互联网活动的有趣摘要,然后截图分享。
关键的转折点是追问 (Follow-up Questions) 功能的上线——这让网站参与时间翻倍,每日问题数量指数级增长。Srinivas 确认:有东西在这里了,不值得砍掉转向企业市场。
与 Google 的竞争:为什么他们做不了这个产品
Srinivas 坦言他从未真正认真思考过与 Google 的竞争——因为他知道 Google 无法在其主页上做出这个产品。原因有三:第一,很难判断一个查询是否纯粹是信息性的;第二,Google 搜索页面已经太拥挤——答案框 (Answer Box)、知识面板 (Knowledge Panel)、广告、链接、社交观点卡片,信息过载;第三,使用 Google 和使用 Perplexity 在信息查询上的体验差异,就像快餐和健康餐的区别。
他更担心的是微软——就在他们与 NEA 握手达成投资条款清单 (Term Sheet) 的当天,The Verge 泄露了 Bing Chat 的截图。一位投资者立刻将尽职调查期从30天延长到45天,另一位当晚约他通话——意图明显。Srinivas 对联合创始人说:"也许他们要退出或让我们转型,也许我们应该把公司卖了。" 但最初握手的那位投资者说:"我不会让你们转型,你们继续做。" 接下来一周,Google 也发布了 Bard 的公告。Srinivas 认为微软从不擅长消费产品,Google 也必然面临自身困境,因此仍有空间留给新玩家。
用户永远是对的:产品哲学
Srinivas 深受 Larry Page 的影响——"用户永远是对的 (The User is Never Wrong)"。他举例:测试新功能时,查询有歧义导致结果不佳,工程师可能倾向于说"查询不够清晰",但 Srinivas 的原则是:产品应该主动澄清——"我不确定您指的是A还是B,请问是哪个?"——而不是直接说"我不知道"。
另一种产品设计方式是"让用户成为更好的提示词工程师 (Prompt Engineer)"——指责用户、教育用户按产品想要的方式使用。企业软件往往是第二种,但伟大的消费产品是第一种。Google 为什么要处理拼写错误?因为 Larry 自己拼写不好(据说拼写检查的真正起源是 YC 合伙人 Paul Buchheit 对拼错的烦恼)。自动补全 (Auto Suggest)、缓存结果 (Cached Results)、甚至 Larry 想在首页模拟窗户外天气让你不用搜索天气——这些设计哲学深深影响了 Srinivas,包括 Perplexity 搜索栏光标自动就绪、无需手动点击的设计。
北极星指标与团队运营
Perplexity 的首要指标是每日查询量 (Queries Per Day)。每次全员会议 (All Hands) 从这个数字开始。Srinivas 不赞同在办公室放电视实时显示指标——太分散注意力——但每周审视增长率、月度增长率是必要的。如果下降就讨论原因,如果增长就研究为什么、在哪里。数据驱动且全公司共享——他甚至在尝试向用户共享数据,让他们感受参与感。
公司没有等级观念——Srinivas 发现 Bug 会直接找负责的工程师,没人觉得受到威胁,因为他每天提50个 Bug。文化和 DNA 源自创始人——Srinivas 确实会因为答案错误而愤怒,会关注 Twitter 上的批评(即使是黑子,只要其中有一丝真实反馈,他都想了解)。X/Twitter 是他与用户沟通的主要渠道——人们在那里极其直白,而邮件中人们过于礼貌,面对面则最不可靠——人们总会说好话,哪怕讨厌你的产品。
规模化的挑战
随着团队从最初几人增长到250人,速度不可避免地在下降。原因不仅是人多了——更多是因为生产环境的 Bug 开始侵蚀用户信任、新工程师没有老员工那样的代码库全局上下文、在"快速行动、打破常规"与"服务大众市场"之间存在张力。Srinivas 坦承他们尚未完全想出最佳方案——预发布测试 (Staging Deployment)、A/B 测试 (AB Test) 都在自然地拖慢速度。
此外,极致关注细节的人才在世界上就那么多——不可能期望第250号工程师也具有同样的特质。但 Srinivas 仍在努力亲自标记 Bug、了解谁在做什么功能,即使在这个规模上。联合创始人也在各自团队中推动这一原则。他在对抗熵增——这是一场上坡路,但只要持续战斗就好。
未来愿景:从答案到行动
Srinivas 眼中 Perplexity 的未来定位是一个更智能的 Google 搜索,在特定场景下极其有用。但3-4年后的愿景更宏大:当你研究"最好的毛衣"或"最好的酒店"时,Perplexity 会给出很好的答案,但你实际去哪里完成需求?你去 Google——而 Google 获得了商业变现的功劳。Perplexity 也许能获得 Pro 订阅费,但其他竞争者可以用更便宜的模型提供免费服务。
因此,核心挑战是成为用户端到端体验的起点:从问题开始,给出答案,然后帮助用户完成行动 (Fulfill the Action)。比如搜索"贝佐斯戴什么手表",答案出现的不仅是信息,还有产品卡片 (Product Card) 和购买按钮——但这与早期采用者对"无广告纯信息体验"的期待产生了张力。还有无数其他场景:查看比赛比分、快速获取 API 文档链接、在联合航空预订航班、查明天天气、查某人净资产——这些应该在一秒内给出答案,而非经过复杂的推理流程。
编排器:最难的工程挑战
Srinivas 认为真正需要构建的是一个小模型 (Small Models)、典型知识图谱 (Knowledge Graphs)、组件 (Widgets)、LLM 流式答案和复杂多步推理答案的精妙编排 (Orchestration)。用户不在乎什么时候用什么——AI 应该自己决定。这个路由器 (Router)、这个编排器 (Orchestrator) 才是最难构建的东西——谁能在十亿用户规模上运营它并知道如何高效变现某些查询,谁就是下一个 Google。
竞争优势:对用户的执念与产品品味
面对 Google、OpenAI、Anthropic 等竞争对手,Srinivas 认为 Perplexity 的优势在于对用户的执念 (Obsession About the User) 和好的产品品味 (Good Product Taste)。在他列出的竞争者中,Google 是唯一真正有产品品味的公司,也拥有所有的分发渠道——但 Google 的困境在于:它是一家搜索公司,同时更是一家广告公司,搜索几乎是为广告公司服务的。Google 搜索季度收入接近2000亿美元,华尔街 (Wall Street) 对搜索收入下滑会自动恐慌——但在人们直接与 AI 对话、智能体代为执行任务的世界里,搜索收入必然下降。Google 能否将 Gemini 等新体验放到已有十亿用户的旧 Google 首页上,是关键问题。
Perplexity 比 OpenAI 和 Anthropic 更有优势,因为在 DNA 中就重视用户和产品——不只是谈论推理和模型,同时也完全有能力使用最新开源模型、自行服务、微调 (Fine-tuning) 和后训练 (Post-training),不做 AI 文盲,也不会把带宽花在建设数据中心和芯片上或只追求最新的编码和数学基准 (Benchmark) 成绩。那些有价值,但与构建下一代信息体验是两回事。