AI 泡沫的真相：2025 年最令人惊讶的趋势与创业机会

摘要

本文整理自 YC 播客《Light Cone》2025 年度回顾特别节目，由 Diana、Jared 和 Gustav 三位 YC 合伙人共同讨论 2025 年 AI 领域最令人惊讶的现象。对话涵盖了多个重大议题：Anthropic 在 YC Winter 26 批次的创始人选择中首次超越 OpenAI 成为最受欢迎的模型 API，从曾经的 90%+ 垄断到如今的多模型竞争格局；Gemini 的强势崛起与 Google 在实时信息检索领域的独特优势；创业者正在实践的"模型套利"（Model Arbitrage）策略——针对不同任务选择最优模型，甚至用 Gemini 做上下文工程（Context Engineering）再喂给 OpenAI 执行；AI 泡沫论的深度辨析——借鉴电信泡沫的历史类比与经济学家 Carlo Perez 的"安装期-部署期"框架，论证当前的重资产投入恰恰为应用层创业者创造了历史性机遇；基础设施瓶颈催生的创新——从太空数据中心到核聚变能源的 YC 公司矩阵；vibe coding（氛围编程）从小众行为成长为巨大品类；AI 经济的"稳态化"趋势——模型层、应用层、基础设施层各就各位；以及第一波 AI 原生公司与第二波挑战者之间（如 Harvey vs. Lora、Sierra vs. Giga）的激烈竞争。核心结论：对基础设施层而言可能是泡沫，但对应用层创业者而言，这是历史上最好的时机。

Anthropic 逆势登顶：YC 创始人模型偏好的历史性转变

Diana 带来了一个令人震惊的数据：在 YC Winter 26 批次的选择周期中，当被问及"你的技术栈和首选模型是什么"时，Anthropic 的 API 首次超越了 OpenAI，成为 YC 创始人的首选。回顾历史，在播客开播之初，OpenAI 的份额曾高达 90% 以上；Anthropic 在 2024 年和 2025 年初长期徘徊在 20%—25% 之间，但仅在最近 3—6 个月内实现了爆发式增长，份额飙升至 52% 以上。

这一转变的核心驱动力是编码类产品。2025 年，vibe coding 工具和编程代理（Coding Agent）在众多品类中取得大量突破，创造了巨大的商业价值，而 Anthropic 的模型在编码任务上表现最优。Diana 指出这不是偶然——从之前与 Tom Brown（Anthropic 联合创始人）的对话中得知，编码能力被 Anthropic 刻意设为内部评估的北极星指标（Northstar Metric），模型的"品味"（Taste）因此直接体现在面向创始人的产品选择上。

不过 Gustav 补充了一个关键观察：大多数使用场景其实并非编码。他推测存在一种"溢出效应"——创始人在个人编程中使用 Claude，进而在非编码应用中也更倾向于选择 Anthropic 的模型，因为他们已经熟悉了 Claude Opus 或 Sonnet 的交互风格和个性。

Gemini 的崛起与模型"个性"之争

Gemini 在 YC 排名中同样大幅攀升：从去年的个位数百分比（约 2%—3%），增长至 Winter 26 批次的约 23%。Gustav 透露他个人今年已将 Gemini 作为日常首选模型，甚至在 Gemini 2.5 Pro 发布之前就已切换——主要原因是在推理能力上的优势。他越来越多地用 Gemini 替代 Google 搜索，信任 Google 的 Grounding API（Grounding API）和利用 Google 索引提供实时准确信息的能力，认为在这方面 Gemini 优于 Perplexity——后者虽然更快，但准确性有时不够。

三位合伙人还讨论了模型"个性"的有趣对比：OpenAI 散发着"黑猫"般的气质，Anthropic 则更像乐于助人的"金毛犬"，Gemini 介于两者之间。Jared 仍然使用 ChatGPT 作为主力，核心原因是"记忆"（Memory）功能形成的黏性——它了解他的性格和思维方式，这种个性化的消费者体验正在成为一种真正的护城河（Moat）。

模型套利：创业者的新常态

一个引人注目的趋势是"模型套利"（Model Arbitrage）正在成为创业标准实践。Gustav 提到 Karpathy 发布的类 LLM Arena 对比方式——同时打开 Claude、Gemini、ChatGPT，给出相同任务，然后让一个模型检验其他模型的输出。这种在消费者层面的行为，在创业公司层面同样普遍：曾经对 OpenAI 或 Anthropic 忠诚的创始人，现在正在构建一个编排层（Orchestration Layer），随新模型发布灵活切换，或为特定任务选用最优模型。

一个典型案例：某创业公司用 Gemini 3 做上下文工程，将结果喂给 OpenAI 执行——并且随着新模型发布不断调整组合。关键在于，这些选择都基于各公司自有的专有评估（Proprietary Evals），尤其是垂直领域 AI 代理公司，拥有自己行业中无法公开的评估数据集。Jared 将此比作 Intel 与 AMD 的架构迭代时代——新架构出来，人们直接替换芯片即可。

AI 泡沫论辨析：电信泡沫的历史启示

Jared 从大学生常问的"AI 是不是泡沫"问题切入，给出了一个清晰的分析框架。他引用了电信泡沫的类比：90 年代，数百亿美元投入电信基础设施建设，许多光纤管道最终闲置（暗光纤，Dark Fiber）——但这恰恰为 YouTube 的诞生创造了条件。带宽过剩意味着视频流媒体的成本足够低，使得全新的商业模式成为可能。

Gustav 引用了经济学家 Carlo Perez 的研究，该研究总结了技术革命的两大阶段：

安装期（Installation Phase）：大量重型资本支出涌入基础设施建设。ChatGPT 时刻（2023 年）引爆了技术热情，催生了 GPU 采购和千兆瓦级数据中心的狂潮——这一阶段看起来就像泡沫。
部署期（Deployment Phase）：技术真正渗透，应用层爆发式增长，创造丰裕与繁荣。

当前正处于从安装期向部署期的过渡阶段——这对创业创始人来说是最好的消息：他们不参与建设数据中心，但将在部署期构建下一代应用。未来的 Facebook、未来的 Google，还没有被创建出来。

Diana 进一步指出：即使 Meta 等巨头过度投资于资本支出，那也是他们的资本支出，不是创业公司的。即使需求骤降，基础设施依然存在，应用层仍然可以继续构建。

基础设施瓶颈催生的创新矩阵

对话揭示了 AI 基础设施瓶颈正在催生一系列前沿创新，形成了 YC 公司的"三重奏"：

StarCloud：2024 年夏季提出太空数据中心的构想，当时遭到互联网群嘲；18 个月后，Google 和 Elon Musk 都在推进类似方案。背后的驱动力是电力不足、土地短缺和监管障碍——特别是加州的 CEQA（California Environmental Quality Act）被环保游说团体滥用，阻挠了几乎所有创新建设和住房项目，太空成为唯一的"泄压阀"。
Boom Supersonic：从超音速客机转向为 AI 数据中心提供能源，使用喷气发动机发电——但喷气发动机的供应链已经严重积压，需要提前两三年下单。
Helion：致力于核聚变能源，为数据中心提供清洁电力。
Zephr Fusion：最新毕业的 YC 公司，由来自国家实验室的工程师创立，他们研究后发现：在太空进行核聚变在物理方程上是成立的——如果成功，将是太空获得千兆瓦级能源的唯一路径。这或许将构成更完美的"四重奏"。

模型创业的民主化浪潮

Gustav 观察到一个显著趋势：创办模型公司的兴趣在两端同时增长——少数团队能筹集到与 OpenAI 正面竞争的资本（如 Ilya Sutskever 的 SSI），而在 YC 内部，更多人尝试构建小型模型，用于边缘设备（Edge Device）或特定语言的语音模型。

Jared 将此与 YC 早期 SaaS 创业爆发做类比：当时关于"如何创业、如何构建软件"的知识逐渐在互联网上普及，社会对创业的认知大增，催生了创业潮。如今，AI 研究与模型训练的知识正在经历同样的民主化过程——十年前 OpenAI 需要研究能力、工程能力和商业融资能力的罕见组合（Ilya、Greg、Sam 的黄金三角），而如今拥有这些复合技能的人才大量涌现。

更重要的是，强化学习（Reinforcement Learning, RL）进一步加速了这一趋势：在开源模型之上，通过特定 RL 环境和任务进行微调，完全可以打造出在垂直领域超越大型通用模型的专业模型。Diana 分享了一个具体案例：某 YC 医疗创业公司仅用 80 亿参数的模型，凭借精心收集的医疗数据集，在医疗基准上击败了 OpenAI。

不过 Gustav 也指出了风险：如果只有微调而没有持续的基础设施投入，当新一代基座模型（如 GPT-4.5、5.1）发布时，之前的微调优势可能被一举抹平——你必须持续前进。

Vibe Coding：从小众行为到巨大品类

Jared 回顾了年初一期关于 vibe coding 的节目——当时他们更多是在观察 YC 创始人中涌现的一种行为，没想到它发展成了 2025 年最大的品类之一。Replit、Emergence 等公司在该领域取得显著成功。Google 的 Veroun Moan 与 Sergey Brin 合作的"anti-gravity"演示视频也引发关注——Sundar Pichai 不仅谈论太空数据中心，也在公开谈论 vibe coding。

不过 Gustav 也保持了清醒：截至 2025 年底，vibe coding 还不能 100% 可靠地生成可投入生产的代码——距离"完全信赖 AI 写出生产级代码"仍有距离，但进步速度惊人。

AI 经济的稳态化：格局渐趋清晰

Gustav 提出了 2025 年最令他惊讶的观察：AI 经济已经趋于稳定。与 2024 年底仍在快速变动、无人知晓下一步走向的状态相比，如今已形成相对清晰的三层结构——模型层公司、应用层公司、基础设施层公司各有定位，各有盈利路径，构建 AI 原生公司的"剧本"也日渐成熟。

Diana 补充道，这背后是模型本身的渐进式改进——2025 年没有出现颠覆性的阶跃突破，这带来连锁效应：之前"只要活下来等几个月就有新突破改变一切"的创业策略正在失效，寻找创业点子的难度正在回归"正常水平"。

Jared 还谈到了"AI 2027"报告的修正——那份末日论报告曾声称社会将在 2027 年崩溃，后来悄悄修改了时间线但保留了标题。他从两个角度表达了谨慎乐观：其一，Scaling Law（缩放定律）是对数线性的（Log-Linear），每一步进展需要 10 倍的算力，增速天然放缓；其二，人类和组织天然抗拒变革——之前被他们批评的"90% 企业 AI 项目失败"的 MIT 报告，换个角度看也说明技术渗透社会的速度有限。这两个因素共同构成了对快速起飞（Fast Takeoff）论调的制动器，使社会有足够时间消化、适应和应对。

团队规模与效率：一人万亿公司尚未到来

Diana 回顾了去年关于"公司仅靠创始人就达到百万美元 ARR（Annual Recurring Revenue）并完成 A 轮融资"的讨论，一年后发现：这些公司并没有继续以极小团队规模扩张至千万 ARR，而是在 A 轮之后开始正常招聘团队。Jared 的判断是：当前的核心瓶颈不是"需要更少的人"，而是"用户期望不断提高"——AI 降低了生产成本，但客户期望相应提升，公司仍需招聘更多能执行的人来满足这些期望。一人运营万亿公司的时代尚未到来，也不会在 2026 年到来。

不过 Diana 指出了一个积极信号：Gamma 在其发布声明中宣布以仅 50 名员工达到 1 亿美元 ARR——这种"以最少人数创造最多收入"的反向展示，取代了传统的"融了多少钱、招了多少人"的宣传模式，是一个值得鼓励的趋势。

第一波与第二波：AI 原生公司的竞争新格局

对话最后讨论了 2025 年 AI 创业竞争的动态演变。第一波 AI 原生公司（如 Harvey）在 2023 年突破，一度宣称赢得了所在领域——但其中不少公司在微调上烧掉了大量资本却未获得持久优势，最终受益的只有投资者（因为他们因此占了更多股份）。

如今第二波挑战者正在强势崛起：Lora 挑战 Harvey、Giga 挑战 Sierra。事实证明，AI 原生公司的护城河并非一旦建立就固若金汤——这个领域的竞争远比想象的激烈，而胜负的关键在于谁能持续执行、谁拥有最好的数据和产品体验。