2024：GPT 包装器神话破灭之年

cover

摘要

2024年，人工智能领域的叙事发生了根本性转变。一年前，当OpenAI推出ChatGPT商店时，业界普遍认为，所有基于大模型构建的应用都不过是脆弱的“GPT包装器”，OpenAI将凭借其平台优势和即将上线的应用商店，碾压所有试图在AI应用层掘金的初创公司。价值将高度集中于基础模型公司，应用层不存在创业机会。

然而，时间快进至2024年底，这一共识已被彻底证伪。本年度不仅是初创公司逆势崛起的一年，更是AI应用层价值被全面验证的一年。那些曾被戏称为“包装器”的应用，在企业级市场中完成了从概念验证到真金白银收入的惊险一跃，其增长速度之快，甚至使YC史上首次出现全批次公司平均实现3倍增长的奇迹。企业不再将生成式AI视为需要“首席创新官”打卡的新奇玩具，而是基于强烈的投资回报率逻辑，快速且理性地进行采购。

这一逆转背后，是开源模型的崛起打破了单一模型的垄断格局。以Meta的Llama为代表的开源模型在2024年首次登顶性能排行榜，宣告“模型选择”时代的到来。当模型本身逐渐走向商品化，产品体验、销售能力、用户反馈响应以及客户留存率等传统商业护城河，其重要性被重新凸显。与此同时，多模型架构、模型路由、后期训练等技术的成熟，也让应用层公司拥有了更强的自主性和不可替代性。2024年，AI不再是实验室中的“幻觉”风险技术，它正化身为可靠的智能体，深入到代码编写、语音交互、后台流程乃至机器人控制等各个垂直领域，驱动着新一轮的创业浪潮。

正文

2024：AI初创公司逆势突围之年

如果说2024年最令人难以置信的变化是什么，那便是创业的时空法则正在被改写。如今，一家公司可以在短短24个月内从零起步，创造出高达数千万美元的收入，而其启动资金可能仅仅只需200万至500万美元。Opus Clip便是其中典范，这类公司甚至无需进行大规模A轮融资，便能实现商业上的腾飞，这在YC社区中已非孤例。

回顾2023年，人们对企业级AI应用的前景充满怀疑。彼时，许多初创公司虽手握企业的概念验证或试点项目，但市场上的冷嘲热讽不绝于耳：这些试点，有多少能真正转化为实际收入？它们是否只是图一时新鲜的“创新官项目”？然而，仅仅一年之后，我们所有身处一线的人都有了切身体会——这些试点项目正在源源不断地转化为真实营收。如今，YC批次中的初创公司比以往任何时候都更快地切入企业销售环节，其收入增长速度之快，达到百万美元年经常性收入里程碑的用时，也是我前所未见的。在最近结束的YC冬季批次中，整个批次的公司在项目期间平均实现了每周10%的增长，即3倍的总增长率。这一成就在YC历史上尚属首次，昔日仅有顶尖梯队才能企及的高度，如今已成为平均水平。市场正以一种前所未有的速度，孕育着数量惊人的准独角兽。

打破“GPT包装器”神话：应用层的价值证明

这一繁荣景象的背后，是一个曾被广泛信奉的预言被彻底粉碎。就在两年前ChatGPT横空出世时，主流看法是：所有的价值都将流向OpenAI。当ChatGPT商店发布时，业界刻薄地将所有调用其接口的应用贬称为“GPT包装器”，认为该商店将如巨浪般轻易摧毁所有AI应用开发者，OpenAI会成为唯一的巨无霸，留给初创公司的机会为零。如今看来，这一论调何其荒谬。谁还记得那个ChatGPT商店？它本身毫无波澜，更关键的是，今天有哪些耀眼的AI应用是OpenAI自己打造的？除了ChatGPT本身，消费端的明星当属Perplexity，企业端的翘楚可能是Glean，在法律科技领域则有CaseText、Harvey和Pruuma，还有PhotoRoom等不一而足。这些爆发式增长的应用，无一出自OpenAI之手。

此后，随着Anthropic推出Claude，共识再次转向，认为价值终将归于几家财大气粗的基础模型公司。要参与AI竞争，就必须像亚马逊、谷歌那样，或依靠巨额风险资本，否则毫无胜算。但又一次，现实证明这完全错误。驱动这一转变的关键因素，是开源浪潮。从模型权重泄露、Meta被迫开源Llama的戏剧性事件开始，人们最初只将它视为一个“落后OpenAI 18个月的酷玩具”。但从Vicuna等衍生模型开始，开发者生态爆发了创新。2024年夏天的转折点在于，Llama首次在各大基准测试中登顶，这一震惊业界的里程碑宣告：模型的选择权，至关重要。当模型不再唯一，垄断定价的基础便不复存在。当你的竞争对手也能轻易获得顶尖模型时，产品本身、销售能力、响应用户反馈的速度以及将客户流失率降至零的能力——这些传统的商业护城河，变得比“捕获未来全部价值”的愿景更具决定性。

从模型路由到多模型编排：应用层的新技术栈

一年前，部分初创公司热衷于构建“模型路由”——一个能根据成本和任务，在多个模型间分配API调用的中间层。当时的主流反对意见是，调用成本将趋近于零，路由没有价值，开发者只会直接调用最强模型。一年后，这一判断也被推翻。模型路由不仅被证明是构建新一代大语言模型应用的绝佳切入点，更演变出更复杂的形态。我们看到越来越多的应用开始采用“多模型架构”：用最快的模型快速解析海量输入，再用最强大的模型处理复杂任务。这不是简单的路由，而是一种精妙的“编排”。一个典型案例是Camper公司，它用最快的模型解析PDF，用o1处理更复杂的逻辑；AI编程工具Cursor同样在其架构中部署了多个模型，有的专用于预测下一行代码，有的则负责理解整个代码库。此外，后期训练也成为应用层公司构建差异化能力的有力武器。例如，YC冬季批次中的Variant公司，致力于用最先进的开源代码大模型进行代码生成，并通过一个庞大的后期训练流程，教会模型“美学”，让AI能直接生成符合设计规范的SVG图标。这种基于开源模型的后期训练路径，有效规避了“所有价值都内化于模型”的陷阱。

从实验室到生产环境：可靠智能体的崛起

企业级AI落地的另一个曾被反复唱衰的理由，是模型的幻觉和不稳定性，这被视为将试点合同转化为真实生产部署的巨大鸿沟。然而，2024年，这条鸿沟已被跨越。AI不仅产生了真实收入，更在大规模生产环境中承担起每天处理数千张工单的任务。这一突破的取得，归功于一系列让智能体变得可靠的工程化方法，以及围绕大模型生长起来的庞大基础设施。一个贯穿全年的重要趋势是，人们开始更多地从“智能体”的视角来理解AI。去年，人们还在讨论“聊天”，而今话题已转向“为各行各业设计智能体”。像Claude推出的“计算机使用”功能，展现了模型执行复杂多步骤任务、操作电脑、调用其他应用的能力，这在一年前是不可想象的。在监管方面，我们似乎也躲过一劫。针对加州SB 1047法案的担忧暂时缓解，而联邦层面的一些不利行政命令似乎也难以存活。这对那些甚至不满一岁的初创公司而言，无疑是松了一口气。虽然我们不敢说可以永远高枕无忧，平台垄断的风险（如当年Windows的Win32）依然存在，但2024年无疑属于初创公司。

Scale AI：一个经典的创业叙事

规模化实验室的崛起，是贯穿这一轮AI浪潮的标志性事件。OpenAI以60亿美元估值融资自不必说，Scale AI也在今年以10亿美金级别融资脱颖而出。而Scale AI的故事，正是YC所推崇的经典创业叙事的缩影：年轻的程序员，凭借比任何人都更聪明、更勤奋的努力，用数年时间，一步步筑起价值百亿的帝国。创始人Alex在面试YC时，做的项目与AI毫无关系——那是一个预约医生APP。他们真正的灵感，源于Alex在Quora的工作经历。当时领先的数据标注服务是亚马逊的Mechanical Turk，背靠巨头，看似不可战胜。但Alex拥有独特的用户视角：他深知Mechanical Turk有多难用。因此，他决定打造一个自己理想中的版本。他们最早的火车头客户，是急需对海量街景图片进行标注的自动驾驶公司Cruise。Scale AI恰好卡位，乘上了第一波计算机视觉驱动的自动驾驶浪潮。当这波浪潮趋缓，大语言模型时代接踵而至，所有公司都需要进行大规模的人类反馈强化学习，而Scale AI再次完美卡位，为自己找到了新的增长引擎。如今，许多面临转型的创始人，也能凭借敏锐的洞察力，在身边发现机会。一位创始人苦寻方向半年无果，最终在自己父母的牙医诊所里找到了灵感，打造了一款牙医诊所的后台AI系统，如今周增长势头迅猛。这正是技术型创始人孤注一掷、追逐微光，并最终找到广阔市场的典型例证。

2024年的浪潮与退潮：垂直AI、编程与机器人

语音AI的垂直化繁荣

语音AI无疑是2024年最具前景的垂直领域之一。一个常被问及的问题是：最终会是一个赢家通吃的基础设施市场，还是一个由上百个垂直应用组成的生态？答案很可能是两者兼有。我们谈到的客户服务，本身就包含无数迥异的垂直场景。一家航空公司的客服智能体，与一家银行或一个B2B SaaS公司的需求截然不同，其背后的工作流也千差万别。会有杰出的语音AI基础设施公司，让构建应用变得轻而易举；同时，也会有成百上千个深入特定行业的垂直应用。这就像Stripe在支付领域的成功，并未吞噬所有依赖支付的互联网应用一样。

AI编程引爆生产力革命

2024年同样是AI编程彻底爆发的一年。绝大多数YC创始人已在使用Cursor等AI集成开发环境，而Devin则证明了大规模编程任务可以被完全自动化。Replit Agent持续进化，让非技术人员也能够在通勤路上创建应用，实现了技术的平民化。更令人兴奋的是，像Anthropic的Artifact这样的工具，允许产品经理通过与Claude对话构建可交互的前端原型，直接为工程师团队提供完整的工作版本。“一人成军”的生产力已成为现实。这甚至正在改变初创公司的招聘模式。一些刚刚获得种子轮融资的创始人，不再急于招聘传统的职能性高管，而是让自己的软件工程师利用大语言模型编写更多自动化流程。这类创始人正在寻觅更具“AI原生”能力的工程师——他们不仅代码功底扎实，更擅长提示工程，能精准判断AI输出的代码是否正确。在面试中，观察候选人与AI工具的配合，甚至已成为一种新的考核方式。这预示着编程面试本身将发生变革，不再禁止使用AI工具，而是直接衡量候选人在使用工具时能达到的绝对产出上限。

机器人：软件已醒，硬件尚存挑战

机器人的ChatGPT时刻虽未完全到来，但已曙光初现。自动驾驶出租车在旧金山的全面商用化，让普通居民每天都亲身体验着机器人技术的成熟。我们今年见到的硬件创业者比以往任何时候都多。一家名为Weave Robotics的公司计划在2025年以约6.5至7万美元的价格，交付一款真正能在家中使用的机器人。当前的思路是，大语言模型可以作为机器人的“意识”，理解指令和与环境互动，而下层的具体动作执行，如叠衣服，则像是被“意识”调用的一个工具。这被称为“语音-语言-行动模型”。当前最大的挑战在于硬件。如果初创公司能够只在软件和AI层面创新，并使其运行在廉价的通用硬件上，那将是巨大的机遇；反之，如果硬件和软件必须深度耦合，那么像特斯拉这样软硬一体的巨头将拥有巨大优势。许多初创公司正试图在特定场景下，创造性地在通用硬件上运行模型，这仍处于早期阶段。

AR的艰难破局

2024年也有失意者，比如增强现实。我们在年初曾头戴Apple Vision Pro兴致勃勃，但一年过去，AR并未起飞。其核心症结在于物理定律的制约——在轻便小巧的形态中塞下足够强大的计算和光学元件，是极为艰巨的工程难题。鸡与蛋的难题依旧存在：没有足够的硬件装机量，开发者缺乏构建杀手级应用的动力；而没有杀手级应用，消费者又缺乏购买昂贵硬件的理由。目前最实用的功能，似乎是将它作为一个巨大的虚拟显示器用来观影。一个有趣的尝试是Meta的Ray-Ban智能眼镜，它虽无显示功能，但其出色的音频和语音交互能力，让人可以随时与ChatGPT或Claude展开对话，成为一种不错的移动学习伴侣。

旧金山与硅谷的回归

最后，2024年的另一个主题是“回归”。YC回到了线下，在旧金山举办了盛大的现场演示日。在共济会中心，1200名投资人齐聚一堂，创始人与投资人的比例高达1:10，现场的能量和活力是Zoom永远无法复制的。它重新成为了硅谷的风险投资人的年度聚会。同样，在度过“远程办公将永久持续”的幻象期后，从成长期到巨头的企业都在急切地推动员工回流办公室。旧金山这座城市本身也在复苏。随着选举尘埃落定，新的市长和趋于温和的市议会多数派为扭转城市的颓势带来了希望。正如创业一样，我们总会高估一年内能做到的事，却低估十年内可能发生的巨变。修复一座城市可能需要十年甚至二十年，但我深切希望，旧金山能继续成为吸引全世界最聪明头脑的灯塔，并持续向前发展。