AI 革命：其他人尚未看到的东西

cover

摘要

本期《光锥》(The Light Cone) 节目录制于 Y Combinator 在索诺玛 (Sonoma) 举办的 AI 创始人峰会之后，汇聚了 YC 合伙人 Diana、Harj、Gary 及 Gmail 创始人 Paul Buchheit (PB) 的深度对话。节目揭示了一个前所未有的现象：YC 近两期（夏季与秋季批次）的创业公司整体平均实现了每周 10% 的增长率，这曾是过去仅顶级公司才能企及的指标。部分企业更是从零做到了 1200 万美元年化收入 (ARR)，仅用 12 个月。

核心发现包括：企业对 AI 的需求呈现出前所未有的热情，决策层无人说"不"，所有人都在说"是"；AI 智能体 (AI Agent) 类创业公司成为增长最快的品类；评估集 (Eval Set) 而非代码库正在成为公司最有价值的资产；设计师已开始用 Claude 替代 Figma 进行 UI 设计；Google 引荐流量下降约 15%；Cursor 在 YC 批次中的采用率从一个批次内的个位数飙升至 80%。节目还深入探讨了"机器货币"与"人类货币"的双经济体系构想、UBI（全民基本收入）的局限性、从 2015 年 YC 内部讨论催生 OpenAI 的历史，以及预测下一个标记 (Next Token Prediction) 作为智能核心函数的哲学意义。创始人应关注的核心能力是能动性 (Agency) 与品味 (Taste)，而非传统的规模化招聘。

周增长 10%：从例外到常态

PB 回忆了 YC 早期的标准：周对周 (Week-on-Week) 10% 的增长率曾被视为极其优秀的指标，通常只有批次中排名前一两名的公司才能达到。然而自去年夏季以来，令人震惊的是——夏季批次和秋季批次在 12 周内整体平均实现了 10% 的周增长。这不再是 Airbnb 级别明星公司的专属，而是整个批次的平均水平。

Diana 指出，这种惊人增长并不限于批次期间。她亲眼见证了一家公司从零增长到 1200 万美元年化经常性收入 (ARR)，仅用了 12 个月，这在过去闻所未闻。更关键的是，这并非孤立案例，多家公司都呈现出类似轨迹。

野心升级：从百万到两千万

Harj 注意到创业公司的执行速度正在大幅提升。过去 YC 建议公司在批次结束后 12-18 个月内争取达到 100 万美元 ARR，这本是 10% 周增长所对应的里程碑。而现在，这一目标似乎成了最低基准——许多公司在六个月内就达到了。更令人惊讶的是，部分已达到百万 ARR 的创始人提出了年度目标：从 100 万增长至 1000 万，甚至 2000 万美元。几年前若有人声称一年内从 100 万做到 2000 万，会被视为天方夜谭。但 AI 时代，整体野心水平已急剧攀升。

企业需求：从阻力到拉力

Gary 分享了 Box CEO Aaron Levie 的观察：在以往的技术周期（云计算、移动互联网）中，大企业的决策者总会有人说"不"——拒绝转型。但 AI 时代截然不同，这是历史上第一次所有人都在说"是"，对 AI 产品的需求量前所未有。

Diana 补充道，所有实现惊人增长率的公司都是同一种类型：向企业出售 AI 智能体 (AI Agent)。这并非说其他公司表现不佳，而是增长最猛的赛道全部聚焦于企业级 AI 智能体，正乘着企业内部对 AI 巨大需求的浪潮。

PB 将此回归 YC 的根本建议：做出人们想要的东西 (Make Something People Want)。传统挑战在于说服客户需要你的产品，而现在需求已经存在，你只需交付一个可用的产品，甚至不需要特别擅长销售。不过 Diana 也提醒，构建真正可用的产品其实极其困难——客户需要的是能够真正替代人工工作的软件，本质上是在卖服务 (Services)，要达到人类同等水平的客户支持、销售电话等表现，这非常非常难。

技术创始人的优势

Harj 注意到一个有趣趋势：许多技术背景浓厚但并不擅长销售的 CEO，现在反而能够赢得大型企业合同。尽管有 10-15 家公司竞争同一合同，但构建出真正可用产品的壁垒极高。仅仅做出能实际完成工作的产品，就足以赢得巨额交易。

这些创始人在产品构建过程中发明了大量新模式，因为没人知道如何让大语言模型 (LLM) 稳定可靠地产生可预测结果。许多人只在表面层次尝试 ChatGPT，遇到幻觉 (Hallucination) 就放弃了。但技术型创始人不会放弃——他们找到了精确定义问题、优化提示 (Prompt) 的方法，使结果高度准确。事实上，已有大量产品被企业购买用于处理复杂任务。

评估集：比代码更珍贵的资产

Gary 分享了周末峰会上最令他印象深刻的转变：创始人们的演讲大量围绕评估 (Evals) 和测试展开——这在以往的 YC 会议中闻所未闻，测试曾是被尽量压缩的"事后诸葛亮"环节。

一位构建 AI 智能体的创始人说，公司最有价值的资产不是代码库，而是评估集 (Eval Set)——一套精心标注的黄金标准数据集，定义了 AI 应给出的正确答案。这让 Gary 意识到：公司确实拥有数据资产，但普通数据并不珍贵，真正有价值的是精心标注的黄金标准评估集。

PB 据此指出，"ChatGPT 套壳" (ChatGPT Wrapper) 的嘲讽根本就是错的。模型在快速变化，至少五家以上的 AI 实验室 (AI Lab) 竞争于前沿，替代模型众多。真正难以获取的资产是评估集和提示工程 (Prompt Engineering)——而这也恰恰是目前最大的机会所在：能动性 (Agency) 和品味 (Taste)。提示就是知道该告诉智能体做什么，评估就是判断结果是否好、是否美、是否有用。

设计师的新工作流：从 Figma 到 Claude

Gary 听到一位创始人的设计师已经完全停止使用 Figma 制作模型。他们的工作流变成了：设计师完全用 Claude 进行设计，从文本直接生成 JavaScript 代码。这让人感到不可思议——设计原本被视为极其视觉化的事，但这位设计师已经具备了足够的品味，将设计转化为文本提示，通过提示工程直接产出代码——其品味和质量与任何 Figma 模型相当。

Gary 总结道：一如既往的规律是——迭代最快者胜。AI 是实现快速迭代的超强工具。

铲子与勺子：Milton Friedman 的启示

PB 引用了著名经济学家米尔顿·弗里德曼 (Milton Friedman) 的经典轶事：弗里德曼访问一个发展中国家，看到大量工人用铲子挖运河，便问政府官员为何不用机器，对方回答"这是一个就业项目"。弗里德曼随即说道："如果是就业项目，应该给他们勺子，而不是铲子。"

PB 认为这个思维模型对当前关于 AI 导致失业的恐惧最有解释力。AI 不是从铲子换成勺子或从铲子换成推土机，而是 AI 能做如此多的工作，使我们能创造更多的财富。这才是未来十年的梦想——AI 极其擅长阅读数千篇论文、消化教科书、处理化学问题，我们有望看到前所未有的生产力水平。

Harj 补充道，历史上每当人类找到更快创造财富的方式，最终都运转良好。过去 97% 的人是农民，现在可能只有 3% 甚至更少。人类似乎非常擅长为自己发明新的工作和新的意义。

机器货币与人类货币

Paul Buchheit 提出了一个他已思考 10-15 年的概念：将世界分为"机器货币" (Machine Money) 和"人类货币" (Human Money)。

机器货币侧的核心目标是利用技术产品创造大规模通缩 (Deflation)，将价格压至接近零，让所有人都能负担。医疗保险是重点领域——目前大多数人难以获得优质医疗，而 10 年内 AI 有望让地球上大多数人享受到比今天在场各位更好的医疗水平。

人类货币侧则是那些我们真正从人类那里获得的、高度价值的东西：现场音乐——人们偏好看乐队现场演出而非对着音箱，抑或机器人演奏。人类货币可能更接近于"你的一小时时间"，形成一种几乎双轨的经济体系。

UBI 的局限与 AI 的替代方案

Gary 指出，双经济体系实际上可能是比全民基本收入 (UBI, Universal Basic Income) 更好的方案。多项 UBI 研究显示结果参差不齐，并未像人们五六年前期望的那样带来更大的幸福感。原因在于人们仍需要人生指导，尤其是 UBI 的目标群体往往本就处于不利的社会位置。

AI 有潜力充当生活教练 (Life Coach)。如果你幸运地拥有优秀的父母和文化环境，你拥有了许多人没有的优势。AI 的伟大承诺在于：将最好的资源以极低成本实现普惠化。

Harj 分享了去年 12 月在越南的经历：发展中国家有大量待建设的基础设施——道路、基建，整个国家仿佛都在施工中。如果机器人能建房、打扫、照料一切，将彻底改变生活水平和日常体验。与其给人们更多"人类货币"，不如直接给他们更好的生活方式。

PB 补充道，人人都能拥有基础保障——甚至可能比今天最富有的人好 5-10 倍的水平——但加利福尼亚的海滨房产这类稀缺资源并非人人可得，这正是"人类货币"所涉及的领域。

AI 的两条道路

Gary 提出对 AI 发展的两个方向：坏的方向是用 AI 来约束、控制、甚至囚禁人类；好的方向是最大化人类能动性 (Human Agency) 与自由，让我们成为最好的自己。他相信我们正在走向好的方向。

我们甚至在创意工具中已能看到这一点——缺乏艺术能力的人可以借助 AI 图像生成传达有趣概念；不会编程的人现在也能创建基本应用。我们正以前所未有的方式实现自己的愿景。

回望 2015：从恐惧到 OpenAI 的诞生

PB 回顾了 2015 年 YC 内部关于 AI 的讨论。当时人们认为早期 AI 基于强化学习 (Reinforcement Learning)，而强化函数的目标是什么并不清晰——当时 AI 在玩电子游戏并试图提高分数。这正是"回形针最大化器" (Paperclip Maximizer) 概念和恐惧的来源：如果给了错误的目标函数会怎样。

此外，基于对人类自身演化的理解——我们的智能作为生存机制而涌现——人们担心 AI 也会为了最大化自身生存概率而消灭人类。

然而过去 10 年的突破性发现是：正确的目标函数仅仅是预测下一个标记 (Predict the Next Token)。智能最原始的形式就是预测接下来发生什么。我们的强化函数本质上就是预测下一步，这是智能的根本核心。而最大的好处是：基于此创造出的智能没有生存驱动力——它不在意被启动、完成工作后消失，因为它只是基于模式预测的能力。

API 线上下的能动性

Gary 提及 Vesh Rao 的概念：社会存在一条"API 线" (API Line)。在线之上，你创造 Uber；在线之下，你为 Uber 开车。在旧模式中，API 线之下的人缺乏能动性 (Agency)，被迫进行永无止境的纸clip 最大化式的劳作。

在 AI 世界中，存在一种担忧：人类只负责写提示，然后庞大机器运转，且永远无法更改提示——那将是暴政。但 PB 指出，也可能会出现法规要求"人在回路" (Human in the Loop)，比如欧盟可能要求公司 CEO 必须是人类。但这本质上也可能是另一种形式的"必须用小勺子而非铲子"。

PB 批评监管者反复犯的根本错误：以静态视角看待世界，试图规制当前结构，从而关闭了演化和展望未来的可能。

OpenAI 的诞生：一个不可能的赌注

2015 年，YC 内部讨论得出的结论是必须创建自己的 AI 实验室。当时所有最优秀的 AI 研究都在 Google 进行——Google 拥有全部资金、数据、用户和研究人员，似乎可能形成垄断。于是有了这个看似荒谬的登月计划：启动一个当时叫"YC Research"的小型非营利组织，后来更名为 OpenAI。

一个小型非营利组织去挑战 Google 来开发通用人工智能 (AGI)——这在当时根本通不过常识检验。然而 10 年后，它真的发生了。如今我们拥有一个开放竞争的市场，至少六家基础模型公司在竞争，包括 Meta 的开源模型。PB 认为这是我们维护自由的最佳途径——选择与竞争。

Google 引荐流量的衰退

Diana 提出了一个关键信号：据部分人报告，Google 引荐流量 (Google Referral Traffic) 在过去一年下降了约 15%。这反映了她自身的行为变化——仍使用 Google，但越来越少点击链接，因为顶部有摘要片段 (Snippet)，或者她直接用 ChatGPT 搜索网页或 Perplexity。

PB 强调：要理解未来，必须观察早期采用者 (Early Adopters) 的行为。回溯 25 年，1999-2000 年的早期采用者使用 Google，当时人们觉得 Google 只是技术人员的边缘工具。如今，同类早期采用者正将行为转向 ChatGPT、Perplexity 等。PB 自己使用 Google 主要仅用于导航——寻找特定网站，而 Google 开始有了类似旧网站（如 eBay）的那种陈旧感。

Gary 补充了更早的信号：Stack Overflow 的流量下降始于 2022 年，甚至早于 ChatGPT，主要因为 GitHub Copilot。如今 Stack Overflow 流量已下降 60%。

YC 创始人：行为预测的风向标

Gary 指出，YC 的技术型创业创始人群体在预测趋势方面有出色记录。2007 年，YC 批次中的创始人都在用 Mac，预示了 Apple 的崛起；所有创始人转向 AWS，预示了从机房到云的迁移。如今，创始人全天候开着 ChatGPT，不断截屏桌面发给 ChatGPT 进行调试或导航政府网站。

更引人注目的是 Cursor 的采用率。从上一批次到下一批次，Cursor 使用率从个位数飙升至约 80%——Gary 想不出有其他工具在 YC 批次中如此迅速地被采用。部分创始人甚至表示：如果面试的工程师不使用 Cursor 或代码生成工具，他们不会录用，因为此人无法跟上团队的生产力水平。

工程面试的演变

Gary 回顾了 Stripe 约在 2011 年开创的面试变革：不再做白板算法题，而是给候选人一台笔记本电脑，在两三个小时内尽可能快地构建一个 Web 应用（如待办事项应用），衡量最大产出。沿此逻辑，现在的问题不是候选人用什么工具，而是标准提高了——有了 Cursor，你应该能在同样时间内构建出远比以前更多的东西。如果面试者仍然坚持寻找清晰的思维和架构问题解决能力，那才会坚持白板题。

SaaS 的颠覆：用代码替代工具

Harj 提出了一个令人震惊的趋势：Klarna 声称不再购买新的 SaaS 工具，而是用 AI 编程替代，也不再招聘新工程师，用现有团队取代所有 SaaS 工具来运营其金融科技业务。

Gary 分享了一个具体案例：Jerry 这家公司，目前年收入已过半亿美元，但几年前仍在每年烧掉 500-1000 万美元，面临严重的客户支持问题。GPT-4 发布后，他们迅速实施，彻底改变了招聘方式——提示 (Prompt) 的管理权交给了客户支持负责人，工程师构建系统后无需再触碰，主要工作变成了提示管理和工作流工具。结果：客户支持团队和预算减半，一家曾经无法增长、每年烧掉 1000 万美元的公司，变成了盈利且现金流充裕、年增长率超过 50% 的企业。

PB 总结道，这正是 AI 创造财富的典范：一整类以前在经济上不可行甚至不可能创建的企业或产品，现在变得可行了。AI 实际上扩大了可能存在的商业领域的版图。

从 Blitz Scaling 到极致杠杆

Harj 观察到一个明显的"氛围转变" (Vibe Shift)：10 年前，公司增长快了就去融资，关键指标是"你招了多少人"——这多少是一种虚荣指标。而如今，达到百万甚至冲刺千万、两千万 ARR 的公司，是以更少的人做到的，且预期以更少的人做到。

Gary 将此与"API 线"概念相连：上一代创业公司需要大规模招聘来构建和运营 API——Uber、Lyft、DoorDash 等市场平台必须超大规模招人。那个时代有"闪电扩张" (Blitz Scaling) 的概念——在利率下行的世界中，投入更多资金利用网络效应，尽可能快地增长、尽可能多地招人，赢家通吃，资本市场会给你注入数百亿补贴增长。

但在这次 300 多位创始人参加的峰会上，Gary 没有听到任何人谈论闪电扩张或尽可能多招人。没有人吹嘘要成为独角兽。现在的一切都关于杠杆 (Leverage)——用最少的资源做最多的事，因为我们拥有赋予超人杠杆的魔法工具。

更长更胖的长尾市场

Gary 指出，AI 将催生一条更长也更"胖"的长尾——不仅是 2000-3000 万美元收入的公司，还有超过数亿美元收入的公司。这回到了之前关于垂直 SaaS (Vertical SaaS) 的讨论：人们对新品类有更多付费意愿，仍在摸索如何定价。支付意愿如此之强是因为人们真心想要这些产品，且预算不只来自软件预算，还来自"AI 首席官" (AI Chief Officer) 等新岗位的专项预算。

Diana 补充道，Aaron Levie 也提到了这一点——达成大额收入的公司普遍采用基于使用量的定价 (Usage-Based Pricing)，价格与使用量挂钩，这更接近卖服务的定价逻辑而非传统软件。

PB 指出其核心是投资回报率 (ROI)：卖产品时客户往往不确定是否获得了 ROI，导致漫长而痛苦的销售周期。但如果你能部署一个当月就能回本的产品，那就是轻松的销售。

RAG vs 无限上下文：工具的不确定性

Harj 提到了一个中间层面的重要问题：工具本身的时间线难以预测。Sam 在演讲中提到，如果拥有无限上下文窗口 (Infinite Context Window)，还需要检索增强生成 (RAG, Retrieval-Augmented Generation) 或检索工具吗？这对创业者和构建者来说是核心焦虑：我现在使用的工具在 3-6 个月后还合理吗？

AI 实验室的人几乎都在谈论更大更好的模型——因为他们是模型制作者，衡量成功的标准就是模型规模和缩放定律 (Scaling Laws) 的推进。但另一面，也有大量精打细算的创始人分享系统级工程的经验。

Tavus 的低延迟突破

Gary 举了一个系统级工程的精彩案例：Tavus 正在构建实时 AI 虚拟人 (AI Avatar)，具备视频和音频，极其逼真。关键技巧是他们实现了极低延迟——600 毫秒，甚至快到让部分客户觉得"太快了，有点恐怖谷效应 (Uncanny Valley)，它总是在打断我"。他们为其他公司提供 SDK，许多产品中 Zoom 视频界面背后的"另一个人"实际上用的就是他们的技术。

这个案例说明：AI 实验室会继续推进模型，也许每 3 个月就有突破；但工程和系统层面的工作才是最有价值的。Tavus 已经重写了好几次技术栈来利用最新进展，产品在市场中反而越变越好。

护城河：品牌、数据与速度

Gary 谈到了护城河 (Moat) 的问题：最终护城河是品牌、是别人没有的数据，有时候就是关心大公司永远不会关心的小客户。但 PB 补充了另一个护城河：创业公司的速度。他观察到许多创始人已经多次重写技术栈——当某个 RAG 方案不工作时，他们毫不犹豫地扔掉向量数据库 (Vector Database)，换成 PG Vector。最好的创业公司将是那些构建最快、愿意站在最前沿、愿意重新评估最佳方案的公司。

Harj 进一步指出，这也是创业公司比大企业更快拿下企业合同的原因。大公司从来就不擅长持续构建优秀软件，而现在如果你需要每 3 个月就替换一次工具来保持前沿——大企业光安排讨论是否重新评估的会议就要花 3 个月。那些实现 600 万到 1200 万收入的公司已经重写了很多次技术栈，几乎每隔一个月就在更换技术方案。

YC 的原初信念被验证

PB 在节目最后回溯了 YC 的根本信念。20 年前，Paul Graham 创立 YC 夏季创始人项目的核心洞察是：创建创业公司变得越来越容易——你不需要筹集大量资本、招聘庞大团队，几个聪明的年轻人就能构建一个 Web 应用。

这一趋势在 AI 时代急剧加速：你可以用寥寥数名员工构建一个 1200 万美元的生意。技术杠杆 (Technological Leverage) 使有野心和洞察力的人能够做到不可思议的事情。从未有过比现在更好的创业时代。