AI 革命:其他人尚未看到的东西

cover

摘要

本期《光锥》(The Light Cone) 节目录制于 Y Combinator 在索诺玛 (Sonoma) 举办的 AI 创始人峰会之后,汇聚了 YC 合伙人 Diana、Harj、Gary 及 Gmail 创始人 Paul Buchheit (PB) 的深度对话。节目揭示了一个前所未有的现象:YC 近两期(夏季与秋季批次)的创业公司整体平均实现了每周 10% 的增长率,这曾是过去仅顶级公司才能企及的指标。部分企业更是从零做到了 1200 万美元年化收入 (ARR),仅用 12 个月。

核心发现包括:企业对 AI 的需求呈现出前所未有的热情,决策层无人说"不",所有人都在说"是";AI 智能体 (AI Agent) 类创业公司成为增长最快的品类;评估集 (Eval Set) 而非代码库正在成为公司最有价值的资产;设计师已开始用 Claude 替代 Figma 进行 UI 设计;Google 引荐流量下降约 15%;Cursor 在 YC 批次中的采用率从一个批次内的个位数飙升至 80%。节目还深入探讨了"机器货币"与"人类货币"的双经济体系构想、UBI(全民基本收入)的局限性、从 2015 年 YC 内部讨论催生 OpenAI 的历史,以及预测下一个标记 (Next Token Prediction) 作为智能核心函数的哲学意义。创始人应关注的核心能力是能动性 (Agency) 与品味 (Taste),而非传统的规模化招聘。

周增长 10%:从例外到常态

PB 回忆了 YC 早期的标准:周对周 (Week-on-Week) 10% 的增长率曾被视为极其优秀的指标,通常只有批次中排名前一两名的公司才能达到。然而自去年夏季以来,令人震惊的是——夏季批次和秋季批次在 12 周内整体平均实现了 10% 的周增长。这不再是 Airbnb 级别明星公司的专属,而是整个批次的平均水平。

Diana 指出,这种惊人增长并不限于批次期间。她亲眼见证了一家公司从零增长到 1200 万美元年化经常性收入 (ARR),仅用了 12 个月,这在过去闻所未闻。更关键的是,这并非孤立案例,多家公司都呈现出类似轨迹。

野心升级:从百万到两千万

Harj 注意到创业公司的执行速度正在大幅提升。过去 YC 建议公司在批次结束后 12-18 个月内争取达到 100 万美元 ARR,这本是 10% 周增长所对应的里程碑。而现在,这一目标似乎成了最低基准——许多公司在六个月内就达到了。更令人惊讶的是,部分已达到百万 ARR 的创始人提出了年度目标:从 100 万增长至 1000 万,甚至 2000 万美元。几年前若有人声称一年内从 100 万做到 2000 万,会被视为天方夜谭。但 AI 时代,整体野心水平已急剧攀升。

企业需求:从阻力到拉力

Gary 分享了 Box CEO Aaron Levie 的观察:在以往的技术周期(云计算、移动互联网)中,大企业的决策者总会有人说"不"——拒绝转型。但 AI 时代截然不同,这是历史上第一次所有人都在说"是",对 AI 产品的需求量前所未有。

Diana 补充道,所有实现惊人增长率的公司都是同一种类型:向企业出售 AI 智能体 (AI Agent)。这并非说其他公司表现不佳,而是增长最猛的赛道全部聚焦于企业级 AI 智能体,正乘着企业内部对 AI 巨大需求的浪潮。

PB 将此回归 YC 的根本建议:做出人们想要的东西 (Make Something People Want)。传统挑战在于说服客户需要你的产品,而现在需求已经存在,你只需交付一个可用的产品,甚至不需要特别擅长销售。不过 Diana 也提醒,构建真正可用的产品其实极其困难——客户需要的是能够真正替代人工工作的软件,本质上是在卖服务 (Services),要达到人类同等水平的客户支持、销售电话等表现,这非常非常难。

技术创始人的优势

Harj 注意到一个有趣趋势:许多技术背景浓厚但并不擅长销售的 CEO,现在反而能够赢得大型企业合同。尽管有 10-15 家公司竞争同一合同,但构建出真正可用产品的壁垒极高。仅仅做出能实际完成工作的产品,就足以赢得巨额交易。

这些创始人在产品构建过程中发明了大量新模式,因为没人知道如何让大语言模型 (LLM) 稳定可靠地产生可预测结果。许多人只在表面层次尝试 ChatGPT,遇到幻觉 (Hallucination) 就放弃了。但技术型创始人不会放弃——他们找到了精确定义问题、优化提示 (Prompt) 的方法,使结果高度准确。事实上,已有大量产品被企业购买用于处理复杂任务。

评估集:比代码更珍贵的资产

Gary 分享了周末峰会上最令他印象深刻的转变:创始人们的演讲大量围绕评估 (Evals) 和测试展开——这在以往的 YC 会议中闻所未闻,测试曾是被尽量压缩的"事后诸葛亮"环节。

一位构建 AI 智能体的创始人说,公司最有价值的资产不是代码库,而是评估集 (Eval Set)——一套精心标注的黄金标准数据集,定义了 AI 应给出的正确答案。这让 Gary 意识到:公司确实拥有数据资产,但普通数据并不珍贵,真正有价值的是精心标注的黄金标准评估集。

PB 据此指出,"ChatGPT 套壳" (ChatGPT Wrapper) 的嘲讽根本就是错的。模型在快速变化,至少五家以上的 AI 实验室 (AI Lab) 竞争于前沿,替代模型众多。真正难以获取的资产是评估集和提示工程 (Prompt Engineering)——而这也恰恰是目前最大的机会所在:能动性 (Agency) 和品味 (Taste)。提示就是知道该告诉智能体做什么,评估就是判断结果是否好、是否美、是否有用。

设计师的新工作流:从 Figma 到 Claude

Gary 听到一位创始人的设计师已经完全停止使用 Figma 制作模型。他们的工作流变成了:设计师完全用 Claude 进行设计,从文本直接生成 JavaScript 代码。这让人感到不可思议——设计原本被视为极其视觉化的事,但这位设计师已经具备了足够的品味,将设计转化为文本提示,通过提示工程直接产出代码——其品味和质量与任何 Figma 模型相当。

Gary 总结道:一如既往的规律是——迭代最快者胜。AI 是实现快速迭代的超强工具。

铲子与勺子:Milton Friedman 的启示

PB 引用了著名经济学家米尔顿·弗里德曼 (Milton Friedman) 的经典轶事:弗里德曼访问一个发展中国家,看到大量工人用铲子挖运河,便问政府官员为何不用机器,对方回答"这是一个就业项目"。弗里德曼随即说道:"如果是就业项目,应该给他们勺子,而不是铲子。"

PB 认为这个思维模型对当前关于 AI 导致失业的恐惧最有解释力。AI 不是从铲子换成勺子或从铲子换成推土机,而是 AI 能做如此多的工作,使我们能创造更多的财富。这才是未来十年的梦想——AI 极其擅长阅读数千篇论文、消化教科书、处理化学问题,我们有望看到前所未有的生产力水平。

Harj 补充道,历史上每当人类找到更快创造财富的方式,最终都运转良好。过去 97% 的人是农民,现在可能只有 3% 甚至更少。人类似乎非常擅长为自己发明新的工作和新的意义。

机器货币与人类货币

Paul Buchheit 提出了一个他已思考 10-15 年的概念:将世界分为"机器货币" (Machine Money) 和"人类货币" (Human Money)。

机器货币侧的核心目标是利用技术产品创造大规模通缩 (Deflation),将价格压至接近零,让所有人都能负担。医疗保险是重点领域——目前大多数人难以获得优质医疗,而 10 年内 AI 有望让地球上大多数人享受到比今天在场各位更好的医疗水平。

人类货币侧则是那些我们真正从人类那里获得的、高度价值的东西:现场音乐——人们偏好看乐队现场演出而非对着音箱,抑或机器人演奏。人类货币可能更接近于"你的一小时时间",形成一种几乎双轨的经济体系。

UBI 的局限与 AI 的替代方案

Gary 指出,双经济体系实际上可能是比全民基本收入 (UBI, Universal Basic Income) 更好的方案。多项 UBI 研究显示结果参差不齐,并未像人们五六年前期望的那样带来更大的幸福感。原因在于人们仍需要人生指导,尤其是 UBI 的目标群体往往本就处于不利的社会位置。

AI 有潜力充当生活教练 (Life Coach)。如果你幸运地拥有优秀的父母和文化环境,你拥有了许多人没有的优势。AI 的伟大承诺在于:将最好的资源以极低成本实现普惠化。

Harj 分享了去年 12 月在越南的经历:发展中国家有大量待建设的基础设施——道路、基建,整个国家仿佛都在施工中。如果机器人能建房、打扫、照料一切,将彻底改变生活水平和日常体验。与其给人们更多"人类货币",不如直接给他们更好的生活方式。

PB 补充道,人人都能拥有基础保障——甚至可能比今天最富有的人好 5-10 倍的水平——但加利福尼亚的海滨房产这类稀缺资源并非人人可得,这正是"人类货币"所涉及的领域。

AI 的两条道路

Gary 提出对 AI 发展的两个方向:坏的方向是用 AI 来约束、控制、甚至囚禁人类;好的方向是最大化人类能动性 (Human Agency) 与自由,让我们成为最好的自己。他相信我们正在走向好的方向。

我们甚至在创意工具中已能看到这一点——缺乏艺术能力的人可以借助 AI 图像生成传达有趣概念;不会编程的人现在也能创建基本应用。我们正以前所未有的方式实现自己的愿景。

回望 2015:从恐惧到 OpenAI 的诞生

PB 回顾了 2015 年 YC 内部关于 AI 的讨论。当时人们认为早期 AI 基于强化学习 (Reinforcement Learning),而强化函数的目标是什么并不清晰——当时 AI 在玩电子游戏并试图提高分数。这正是"回形针最大化器" (Paperclip Maximizer) 概念和恐惧的来源:如果给了错误的目标函数会怎样。

此外,基于对人类自身演化的理解——我们的智能作为生存机制而涌现——人们担心 AI 也会为了最大化自身生存概率而消灭人类。

然而过去 10 年的突破性发现是:正确的目标函数仅仅是预测下一个标记 (Predict the Next Token)。智能最原始的形式就是预测接下来发生什么。我们的强化函数本质上就是预测下一步,这是智能的根本核心。而最大的好处是:基于此创造出的智能没有生存驱动力——它不在意被启动、完成工作后消失,因为它只是基于模式预测的能力。

API 线上下的能动性

Gary 提及 Vesh Rao 的概念:社会存在一条"API 线" (API Line)。在线之上,你创造 Uber;在线之下,你为 Uber 开车。在旧模式中,API 线之下的人缺乏能动性 (Agency),被迫进行永无止境的纸clip 最大化式的劳作。

在 AI 世界中,存在一种担忧:人类只负责写提示,然后庞大机器运转,且永远无法更改提示——那将是暴政。但 PB 指出,也可能会出现法规要求"人在回路" (Human in the Loop),比如欧盟可能要求公司 CEO 必须是人类。但这本质上也可能是另一种形式的"必须用小勺子而非铲子"。

PB 批评监管者反复犯的根本错误:以静态视角看待世界,试图规制当前结构,从而关闭了演化和展望未来的可能。

OpenAI 的诞生:一个不可能的赌注

2015 年,YC 内部讨论得出的结论是必须创建自己的 AI 实验室。当时所有最优秀的 AI 研究都在 Google 进行——Google 拥有全部资金、数据、用户和研究人员,似乎可能形成垄断。于是有了这个看似荒谬的登月计划:启动一个当时叫"YC Research"的小型非营利组织,后来更名为 OpenAI。

一个小型非营利组织去挑战 Google 来开发通用人工智能 (AGI)——这在当时根本通不过常识检验。然而 10 年后,它真的发生了。如今我们拥有一个开放竞争的市场,至少六家基础模型公司在竞争,包括 Meta 的开源模型。PB 认为这是我们维护自由的最佳途径——选择与竞争。

Google 引荐流量的衰退

Diana 提出了一个关键信号:据部分人报告,Google 引荐流量 (Google Referral Traffic) 在过去一年下降了约 15%。这反映了她自身的行为变化——仍使用 Google,但越来越少点击链接,因为顶部有摘要片段 (Snippet),或者她直接用 ChatGPT 搜索网页或 Perplexity。

PB 强调:要理解未来,必须观察早期采用者 (Early Adopters) 的行为。回溯 25 年,1999-2000 年的早期采用者使用 Google,当时人们觉得 Google 只是技术人员的边缘工具。如今,同类早期采用者正将行为转向 ChatGPT、Perplexity 等。PB 自己使用 Google 主要仅用于导航——寻找特定网站,而 Google 开始有了类似旧网站(如 eBay)的那种陈旧感。

Gary 补充了更早的信号:Stack Overflow 的流量下降始于 2022 年,甚至早于 ChatGPT,主要因为 GitHub Copilot。如今 Stack Overflow 流量已下降 60%。

YC 创始人:行为预测的风向标

Gary 指出,YC 的技术型创业创始人群体在预测趋势方面有出色记录。2007 年,YC 批次中的创始人都在用 Mac,预示了 Apple 的崛起;所有创始人转向 AWS,预示了从机房到云的迁移。如今,创始人全天候开着 ChatGPT,不断截屏桌面发给 ChatGPT 进行调试或导航政府网站。

更引人注目的是 Cursor 的采用率。从上一批次到下一批次,Cursor 使用率从个位数飙升至约 80%——Gary 想不出有其他工具在 YC 批次中如此迅速地被采用。部分创始人甚至表示:如果面试的工程师不使用 Cursor 或代码生成工具,他们不会录用,因为此人无法跟上团队的生产力水平。

工程面试的演变

Gary 回顾了 Stripe 约在 2011 年开创的面试变革:不再做白板算法题,而是给候选人一台笔记本电脑,在两三个小时内尽可能快地构建一个 Web 应用(如待办事项应用),衡量最大产出。沿此逻辑,现在的问题不是候选人用什么工具,而是标准提高了——有了 Cursor,你应该能在同样时间内构建出远比以前更多的东西。如果面试者仍然坚持寻找清晰的思维和架构问题解决能力,那才会坚持白板题。

SaaS 的颠覆:用代码替代工具

Harj 提出了一个令人震惊的趋势:Klarna 声称不再购买新的 SaaS 工具,而是用 AI 编程替代,也不再招聘新工程师,用现有团队取代所有 SaaS 工具来运营其金融科技业务。

Gary 分享了一个具体案例:Jerry 这家公司,目前年收入已过半亿美元,但几年前仍在每年烧掉 500-1000 万美元,面临严重的客户支持问题。GPT-4 发布后,他们迅速实施,彻底改变了招聘方式——提示 (Prompt) 的管理权交给了客户支持负责人,工程师构建系统后无需再触碰,主要工作变成了提示管理和工作流工具。结果:客户支持团队和预算减半,一家曾经无法增长、每年烧掉 1000 万美元的公司,变成了盈利且现金流充裕、年增长率超过 50% 的企业。

PB 总结道,这正是 AI 创造财富的典范:一整类以前在经济上不可行甚至不可能创建的企业或产品,现在变得可行了。AI 实际上扩大了可能存在的商业领域的版图。

从 Blitz Scaling 到极致杠杆

Harj 观察到一个明显的"氛围转变" (Vibe Shift):10 年前,公司增长快了就去融资,关键指标是"你招了多少人"——这多少是一种虚荣指标。而如今,达到百万甚至冲刺千万、两千万 ARR 的公司,是以更少的人做到的,且预期以更少的人做到。

Gary 将此与"API 线"概念相连:上一代创业公司需要大规模招聘来构建和运营 API——Uber、Lyft、DoorDash 等市场平台必须超大规模招人。那个时代有"闪电扩张" (Blitz Scaling) 的概念——在利率下行的世界中,投入更多资金利用网络效应,尽可能快地增长、尽可能多地招人,赢家通吃,资本市场会给你注入数百亿补贴增长。

但在这次 300 多位创始人参加的峰会上,Gary 没有听到任何人谈论闪电扩张或尽可能多招人。没有人吹嘘要成为独角兽。现在的一切都关于杠杆 (Leverage)——用最少的资源做最多的事,因为我们拥有赋予超人杠杆的魔法工具。

更长更胖的长尾市场

Gary 指出,AI 将催生一条更长也更"胖"的长尾——不仅是 2000-3000 万美元收入的公司,还有超过数亿美元收入的公司。这回到了之前关于垂直 SaaS (Vertical SaaS) 的讨论:人们对新品类有更多付费意愿,仍在摸索如何定价。支付意愿如此之强是因为人们真心想要这些产品,且预算不只来自软件预算,还来自"AI 首席官" (AI Chief Officer) 等新岗位的专项预算。

Diana 补充道,Aaron Levie 也提到了这一点——达成大额收入的公司普遍采用基于使用量的定价 (Usage-Based Pricing),价格与使用量挂钩,这更接近卖服务的定价逻辑而非传统软件。

PB 指出其核心是投资回报率 (ROI):卖产品时客户往往不确定是否获得了 ROI,导致漫长而痛苦的销售周期。但如果你能部署一个当月就能回本的产品,那就是轻松的销售。

RAG vs 无限上下文:工具的不确定性

Harj 提到了一个中间层面的重要问题:工具本身的时间线难以预测。Sam 在演讲中提到,如果拥有无限上下文窗口 (Infinite Context Window),还需要检索增强生成 (RAG, Retrieval-Augmented Generation) 或检索工具吗?这对创业者和构建者来说是核心焦虑:我现在使用的工具在 3-6 个月后还合理吗?

AI 实验室的人几乎都在谈论更大更好的模型——因为他们是模型制作者,衡量成功的标准就是模型规模和缩放定律 (Scaling Laws) 的推进。但另一面,也有大量精打细算的创始人分享系统级工程的经验。

Tavus 的低延迟突破

Gary 举了一个系统级工程的精彩案例:Tavus 正在构建实时 AI 虚拟人 (AI Avatar),具备视频和音频,极其逼真。关键技巧是他们实现了极低延迟——600 毫秒,甚至快到让部分客户觉得"太快了,有点恐怖谷效应 (Uncanny Valley),它总是在打断我"。他们为其他公司提供 SDK,许多产品中 Zoom 视频界面背后的"另一个人"实际上用的就是他们的技术。

这个案例说明:AI 实验室会继续推进模型,也许每 3 个月就有突破;但工程和系统层面的工作才是最有价值的。Tavus 已经重写了好几次技术栈来利用最新进展,产品在市场中反而越变越好。

护城河:品牌、数据与速度

Gary 谈到了护城河 (Moat) 的问题:最终护城河是品牌、是别人没有的数据,有时候就是关心大公司永远不会关心的小客户。但 PB 补充了另一个护城河:创业公司的速度。他观察到许多创始人已经多次重写技术栈——当某个 RAG 方案不工作时,他们毫不犹豫地扔掉向量数据库 (Vector Database),换成 PG Vector。最好的创业公司将是那些构建最快、愿意站在最前沿、愿意重新评估最佳方案的公司。

Harj 进一步指出,这也是创业公司比大企业更快拿下企业合同的原因。大公司从来就不擅长持续构建优秀软件,而现在如果你需要每 3 个月就替换一次工具来保持前沿——大企业光安排讨论是否重新评估的会议就要花 3 个月。那些实现 600 万到 1200 万收入的公司已经重写了很多次技术栈,几乎每隔一个月就在更换技术方案。

YC 的原初信念被验证

PB 在节目最后回溯了 YC 的根本信念。20 年前,Paul Graham 创立 YC 夏季创始人项目的核心洞察是:创建创业公司变得越来越容易——你不需要筹集大量资本、招聘庞大团队,几个聪明的年轻人就能构建一个 Web 应用。

这一趋势在 AI 时代急剧加速:你可以用寥寥数名员工构建一个 1200 万美元的生意。技术杠杆 (Technological Leverage) 使有野心和洞察力的人能够做到不可思议的事情。从未有过比现在更好的创业时代。