AI 泡沫的真相:2025 年最令人惊讶的趋势与创业机会

封面

摘要

本文整理自 YC 播客《Light Cone》2025 年度回顾特别节目,由 Diana、Jared 和 Gustav 三位 YC 合伙人共同讨论 2025 年 AI 领域最令人惊讶的现象。对话涵盖了多个重大议题:Anthropic 在 YC Winter 26 批次的创始人选择中首次超越 OpenAI 成为最受欢迎的模型 API,从曾经的 90%+ 垄断到如今的多模型竞争格局;Gemini 的强势崛起与 Google 在实时信息检索领域的独特优势;创业者正在实践的"模型套利"(Model Arbitrage)策略——针对不同任务选择最优模型,甚至用 Gemini 做上下文工程(Context Engineering)再喂给 OpenAI 执行;AI 泡沫论的深度辨析——借鉴电信泡沫的历史类比与经济学家 Carlo Perez 的"安装期-部署期"框架,论证当前的重资产投入恰恰为应用层创业者创造了历史性机遇;基础设施瓶颈催生的创新——从太空数据中心到核聚变能源的 YC 公司矩阵;vibe coding(氛围编程)从小众行为成长为巨大品类;AI 经济的"稳态化"趋势——模型层、应用层、基础设施层各就各位;以及第一波 AI 原生公司与第二波挑战者之间(如 Harvey vs. Lora、Sierra vs. Giga)的激烈竞争。核心结论:对基础设施层而言可能是泡沫,但对应用层创业者而言,这是历史上最好的时机。

Anthropic 逆势登顶:YC 创始人模型偏好的历史性转变

Diana 带来了一个令人震惊的数据:在 YC Winter 26 批次的选择周期中,当被问及"你的技术栈和首选模型是什么"时,Anthropic 的 API 首次超越了 OpenAI,成为 YC 创始人的首选。回顾历史,在播客开播之初,OpenAI 的份额曾高达 90% 以上;Anthropic 在 2024 年和 2025 年初长期徘徊在 20%—25% 之间,但仅在最近 3—6 个月内实现了爆发式增长,份额飙升至 52% 以上。

这一转变的核心驱动力是编码类产品。2025 年,vibe coding 工具和编程代理(Coding Agent)在众多品类中取得大量突破,创造了巨大的商业价值,而 Anthropic 的模型在编码任务上表现最优。Diana 指出这不是偶然——从之前与 Tom Brown(Anthropic 联合创始人)的对话中得知,编码能力被 Anthropic 刻意设为内部评估的北极星指标(Northstar Metric),模型的"品味"(Taste)因此直接体现在面向创始人的产品选择上。

不过 Gustav 补充了一个关键观察:大多数使用场景其实并非编码。他推测存在一种"溢出效应"——创始人在个人编程中使用 Claude,进而在非编码应用中也更倾向于选择 Anthropic 的模型,因为他们已经熟悉了 Claude Opus 或 Sonnet 的交互风格和个性。

Gemini 的崛起与模型"个性"之争

Gemini 在 YC 排名中同样大幅攀升:从去年的个位数百分比(约 2%—3%),增长至 Winter 26 批次的约 23%。Gustav 透露他个人今年已将 Gemini 作为日常首选模型,甚至在 Gemini 2.5 Pro 发布之前就已切换——主要原因是在推理能力上的优势。他越来越多地用 Gemini 替代 Google 搜索,信任 Google 的 Grounding API(Grounding API)和利用 Google 索引提供实时准确信息的能力,认为在这方面 Gemini 优于 Perplexity——后者虽然更快,但准确性有时不够。

三位合伙人还讨论了模型"个性"的有趣对比:OpenAI 散发着"黑猫"般的气质,Anthropic 则更像乐于助人的"金毛犬",Gemini 介于两者之间。Jared 仍然使用 ChatGPT 作为主力,核心原因是"记忆"(Memory)功能形成的黏性——它了解他的性格和思维方式,这种个性化的消费者体验正在成为一种真正的护城河(Moat)。

模型套利:创业者的新常态

一个引人注目的趋势是"模型套利"(Model Arbitrage)正在成为创业标准实践。Gustav 提到 Karpathy 发布的类 LLM Arena 对比方式——同时打开 Claude、Gemini、ChatGPT,给出相同任务,然后让一个模型检验其他模型的输出。这种在消费者层面的行为,在创业公司层面同样普遍:曾经对 OpenAI 或 Anthropic 忠诚的创始人,现在正在构建一个编排层(Orchestration Layer),随新模型发布灵活切换,或为特定任务选用最优模型。

一个典型案例:某创业公司用 Gemini 3 做上下文工程,将结果喂给 OpenAI 执行——并且随着新模型发布不断调整组合。关键在于,这些选择都基于各公司自有的专有评估(Proprietary Evals),尤其是垂直领域 AI 代理公司,拥有自己行业中无法公开的评估数据集。Jared 将此比作 Intel 与 AMD 的架构迭代时代——新架构出来,人们直接替换芯片即可。

AI 泡沫论辨析:电信泡沫的历史启示

Jared 从大学生常问的"AI 是不是泡沫"问题切入,给出了一个清晰的分析框架。他引用了电信泡沫的类比:90 年代,数百亿美元投入电信基础设施建设,许多光纤管道最终闲置(暗光纤,Dark Fiber)——但这恰恰为 YouTube 的诞生创造了条件。带宽过剩意味着视频流媒体的成本足够低,使得全新的商业模式成为可能。

Gustav 引用了经济学家 Carlo Perez 的研究,该研究总结了技术革命的两大阶段:

  1. 安装期(Installation Phase):大量重型资本支出涌入基础设施建设。ChatGPT 时刻(2023 年)引爆了技术热情,催生了 GPU 采购和千兆瓦级数据中心的狂潮——这一阶段看起来就像泡沫。
  2. 部署期(Deployment Phase):技术真正渗透,应用层爆发式增长,创造丰裕与繁荣。

当前正处于从安装期向部署期的过渡阶段——这对创业创始人来说是最好的消息:他们不参与建设数据中心,但将在部署期构建下一代应用。未来的 Facebook、未来的 Google,还没有被创建出来。

Diana 进一步指出:即使 Meta 等巨头过度投资于资本支出,那也是他们的资本支出,不是创业公司的。即使需求骤降,基础设施依然存在,应用层仍然可以继续构建。

基础设施瓶颈催生的创新矩阵

对话揭示了 AI 基础设施瓶颈正在催生一系列前沿创新,形成了 YC 公司的"三重奏":

模型创业的民主化浪潮

Gustav 观察到一个显著趋势:创办模型公司的兴趣在两端同时增长——少数团队能筹集到与 OpenAI 正面竞争的资本(如 Ilya Sutskever 的 SSI),而在 YC 内部,更多人尝试构建小型模型,用于边缘设备(Edge Device)或特定语言的语音模型。

Jared 将此与 YC 早期 SaaS 创业爆发做类比:当时关于"如何创业、如何构建软件"的知识逐渐在互联网上普及,社会对创业的认知大增,催生了创业潮。如今,AI 研究与模型训练的知识正在经历同样的民主化过程——十年前 OpenAI 需要研究能力、工程能力和商业融资能力的罕见组合(Ilya、Greg、Sam 的黄金三角),而如今拥有这些复合技能的人才大量涌现。

更重要的是,强化学习(Reinforcement Learning, RL)进一步加速了这一趋势:在开源模型之上,通过特定 RL 环境和任务进行微调,完全可以打造出在垂直领域超越大型通用模型的专业模型。Diana 分享了一个具体案例:某 YC 医疗创业公司仅用 80 亿参数的模型,凭借精心收集的医疗数据集,在医疗基准上击败了 OpenAI。

不过 Gustav 也指出了风险:如果只有微调而没有持续的基础设施投入,当新一代基座模型(如 GPT-4.5、5.1)发布时,之前的微调优势可能被一举抹平——你必须持续前进。

Vibe Coding:从小众行为到巨大品类

Jared 回顾了年初一期关于 vibe coding 的节目——当时他们更多是在观察 YC 创始人中涌现的一种行为,没想到它发展成了 2025 年最大的品类之一。Replit、Emergence 等公司在该领域取得显著成功。Google 的 Veroun Moan 与 Sergey Brin 合作的"anti-gravity"演示视频也引发关注——Sundar Pichai 不仅谈论太空数据中心,也在公开谈论 vibe coding。

不过 Gustav 也保持了清醒:截至 2025 年底,vibe coding 还不能 100% 可靠地生成可投入生产的代码——距离"完全信赖 AI 写出生产级代码"仍有距离,但进步速度惊人。

AI 经济的稳态化:格局渐趋清晰

Gustav 提出了 2025 年最令他惊讶的观察:AI 经济已经趋于稳定。与 2024 年底仍在快速变动、无人知晓下一步走向的状态相比,如今已形成相对清晰的三层结构——模型层公司、应用层公司、基础设施层公司各有定位,各有盈利路径,构建 AI 原生公司的"剧本"也日渐成熟。

Diana 补充道,这背后是模型本身的渐进式改进——2025 年没有出现颠覆性的阶跃突破,这带来连锁效应:之前"只要活下来等几个月就有新突破改变一切"的创业策略正在失效,寻找创业点子的难度正在回归"正常水平"。

Jared 还谈到了"AI 2027"报告的修正——那份末日论报告曾声称社会将在 2027 年崩溃,后来悄悄修改了时间线但保留了标题。他从两个角度表达了谨慎乐观:其一,Scaling Law(缩放定律)是对数线性的(Log-Linear),每一步进展需要 10 倍的算力,增速天然放缓;其二,人类和组织天然抗拒变革——之前被他们批评的"90% 企业 AI 项目失败"的 MIT 报告,换个角度看也说明技术渗透社会的速度有限。这两个因素共同构成了对快速起飞(Fast Takeoff)论调的制动器,使社会有足够时间消化、适应和应对。

团队规模与效率:一人万亿公司尚未到来

Diana 回顾了去年关于"公司仅靠创始人就达到百万美元 ARR(Annual Recurring Revenue)并完成 A 轮融资"的讨论,一年后发现:这些公司并没有继续以极小团队规模扩张至千万 ARR,而是在 A 轮之后开始正常招聘团队。Jared 的判断是:当前的核心瓶颈不是"需要更少的人",而是"用户期望不断提高"——AI 降低了生产成本,但客户期望相应提升,公司仍需招聘更多能执行的人来满足这些期望。一人运营万亿公司的时代尚未到来,也不会在 2026 年到来。

不过 Diana 指出了一个积极信号:Gamma 在其发布声明中宣布以仅 50 名员工达到 1 亿美元 ARR——这种"以最少人数创造最多收入"的反向展示,取代了传统的"融了多少钱、招了多少人"的宣传模式,是一个值得鼓励的趋势。

第一波与第二波:AI 原生公司的竞争新格局

对话最后讨论了 2025 年 AI 创业竞争的动态演变。第一波 AI 原生公司(如 Harvey)在 2023 年突破,一度宣称赢得了所在领域——但其中不少公司在微调上烧掉了大量资本却未获得持久优势,最终受益的只有投资者(因为他们因此占了更多股份)。

如今第二波挑战者正在强势崛起:Lora 挑战 Harvey、Giga 挑战 Sierra。事实证明,AI 原生公司的护城河并非一旦建立就固若金汤——这个领域的竞争远比想象的激烈,而胜负的关键在于谁能持续执行、谁拥有最好的数据和产品体验。