2024:GPT 包装器神话破灭之年

cover

摘要

2024年,人工智能领域的叙事发生了根本性转变。一年前,当OpenAI推出ChatGPT商店时,业界普遍认为,所有基于大模型构建的应用都不过是脆弱的“GPT包装器”,OpenAI将凭借其平台优势和即将上线的应用商店,碾压所有试图在AI应用层掘金的初创公司。价值将高度集中于基础模型公司,应用层不存在创业机会。

然而,时间快进至2024年底,这一共识已被彻底证伪。本年度不仅是初创公司逆势崛起的一年,更是AI应用层价值被全面验证的一年。那些曾被戏称为“包装器”的应用,在企业级市场中完成了从概念验证到真金白银收入的惊险一跃,其增长速度之快,甚至使YC史上首次出现全批次公司平均实现3倍增长的奇迹。企业不再将生成式AI视为需要“首席创新官”打卡的新奇玩具,而是基于强烈的投资回报率逻辑,快速且理性地进行采购。

这一逆转背后,是开源模型的崛起打破了单一模型的垄断格局。以Meta的Llama为代表的开源模型在2024年首次登顶性能排行榜,宣告“模型选择”时代的到来。当模型本身逐渐走向商品化,产品体验、销售能力、用户反馈响应以及客户留存率等传统商业护城河,其重要性被重新凸显。与此同时,多模型架构、模型路由、后期训练等技术的成熟,也让应用层公司拥有了更强的自主性和不可替代性。2024年,AI不再是实验室中的“幻觉”风险技术,它正化身为可靠的智能体,深入到代码编写、语音交互、后台流程乃至机器人控制等各个垂直领域,驱动着新一轮的创业浪潮。

正文

2024:AI初创公司逆势突围之年

如果说2024年最令人难以置信的变化是什么,那便是创业的时空法则正在被改写。如今,一家公司可以在短短24个月内从零起步,创造出高达数千万美元的收入,而其启动资金可能仅仅只需200万至500万美元。Opus Clip便是其中典范,这类公司甚至无需进行大规模A轮融资,便能实现商业上的腾飞,这在YC社区中已非孤例。

回顾2023年,人们对企业级AI应用的前景充满怀疑。彼时,许多初创公司虽手握企业的概念验证或试点项目,但市场上的冷嘲热讽不绝于耳:这些试点,有多少能真正转化为实际收入?它们是否只是图一时新鲜的“创新官项目”?然而,仅仅一年之后,我们所有身处一线的人都有了切身体会——这些试点项目正在源源不断地转化为真实营收。如今,YC批次中的初创公司比以往任何时候都更快地切入企业销售环节,其收入增长速度之快,达到百万美元年经常性收入里程碑的用时,也是我前所未见的。在最近结束的YC冬季批次中,整个批次的公司在项目期间平均实现了每周10%的增长,即3倍的总增长率。这一成就在YC历史上尚属首次,昔日仅有顶尖梯队才能企及的高度,如今已成为平均水平。市场正以一种前所未有的速度,孕育着数量惊人的准独角兽。

打破“GPT包装器”神话:应用层的价值证明

这一繁荣景象的背后,是一个曾被广泛信奉的预言被彻底粉碎。就在两年前ChatGPT横空出世时,主流看法是:所有的价值都将流向OpenAI。当ChatGPT商店发布时,业界刻薄地将所有调用其接口的应用贬称为“GPT包装器”,认为该商店将如巨浪般轻易摧毁所有AI应用开发者,OpenAI会成为唯一的巨无霸,留给初创公司的机会为零。如今看来,这一论调何其荒谬。谁还记得那个ChatGPT商店?它本身毫无波澜,更关键的是,今天有哪些耀眼的AI应用是OpenAI自己打造的?除了ChatGPT本身,消费端的明星当属Perplexity,企业端的翘楚可能是Glean,在法律科技领域则有CaseText、Harvey和Pruuma,还有PhotoRoom等不一而足。这些爆发式增长的应用,无一出自OpenAI之手。

此后,随着Anthropic推出Claude,共识再次转向,认为价值终将归于几家财大气粗的基础模型公司。要参与AI竞争,就必须像亚马逊、谷歌那样,或依靠巨额风险资本,否则毫无胜算。但又一次,现实证明这完全错误。驱动这一转变的关键因素,是开源浪潮。从模型权重泄露、Meta被迫开源Llama的戏剧性事件开始,人们最初只将它视为一个“落后OpenAI 18个月的酷玩具”。但从Vicuna等衍生模型开始,开发者生态爆发了创新。2024年夏天的转折点在于,Llama首次在各大基准测试中登顶,这一震惊业界的里程碑宣告:模型的选择权,至关重要。当模型不再唯一,垄断定价的基础便不复存在。当你的竞争对手也能轻易获得顶尖模型时,产品本身、销售能力、响应用户反馈的速度以及将客户流失率降至零的能力——这些传统的商业护城河,变得比“捕获未来全部价值”的愿景更具决定性。

从模型路由到多模型编排:应用层的新技术栈

一年前,部分初创公司热衷于构建“模型路由”——一个能根据成本和任务,在多个模型间分配API调用的中间层。当时的主流反对意见是,调用成本将趋近于零,路由没有价值,开发者只会直接调用最强模型。一年后,这一判断也被推翻。模型路由不仅被证明是构建新一代大语言模型应用的绝佳切入点,更演变出更复杂的形态。我们看到越来越多的应用开始采用“多模型架构”:用最快的模型快速解析海量输入,再用最强大的模型处理复杂任务。这不是简单的路由,而是一种精妙的“编排”。一个典型案例是Camper公司,它用最快的模型解析PDF,用o1处理更复杂的逻辑;AI编程工具Cursor同样在其架构中部署了多个模型,有的专用于预测下一行代码,有的则负责理解整个代码库。此外,后期训练也成为应用层公司构建差异化能力的有力武器。例如,YC冬季批次中的Variant公司,致力于用最先进的开源代码大模型进行代码生成,并通过一个庞大的后期训练流程,教会模型“美学”,让AI能直接生成符合设计规范的SVG图标。这种基于开源模型的后期训练路径,有效规避了“所有价值都内化于模型”的陷阱。

从实验室到生产环境:可靠智能体的崛起

企业级AI落地的另一个曾被反复唱衰的理由,是模型的幻觉和不稳定性,这被视为将试点合同转化为真实生产部署的巨大鸿沟。然而,2024年,这条鸿沟已被跨越。AI不仅产生了真实收入,更在大规模生产环境中承担起每天处理数千张工单的任务。这一突破的取得,归功于一系列让智能体变得可靠的工程化方法,以及围绕大模型生长起来的庞大基础设施。一个贯穿全年的重要趋势是,人们开始更多地从“智能体”的视角来理解AI。去年,人们还在讨论“聊天”,而今话题已转向“为各行各业设计智能体”。像Claude推出的“计算机使用”功能,展现了模型执行复杂多步骤任务、操作电脑、调用其他应用的能力,这在一年前是不可想象的。在监管方面,我们似乎也躲过一劫。针对加州SB 1047法案的担忧暂时缓解,而联邦层面的一些不利行政命令似乎也难以存活。这对那些甚至不满一岁的初创公司而言,无疑是松了一口气。虽然我们不敢说可以永远高枕无忧,平台垄断的风险(如当年Windows的Win32)依然存在,但2024年无疑属于初创公司。

Scale AI:一个经典的创业叙事

规模化实验室的崛起,是贯穿这一轮AI浪潮的标志性事件。OpenAI以60亿美元估值融资自不必说,Scale AI也在今年以10亿美金级别融资脱颖而出。而Scale AI的故事,正是YC所推崇的经典创业叙事的缩影:年轻的程序员,凭借比任何人都更聪明、更勤奋的努力,用数年时间,一步步筑起价值百亿的帝国。创始人Alex在面试YC时,做的项目与AI毫无关系——那是一个预约医生APP。他们真正的灵感,源于Alex在Quora的工作经历。当时领先的数据标注服务是亚马逊的Mechanical Turk,背靠巨头,看似不可战胜。但Alex拥有独特的用户视角:他深知Mechanical Turk有多难用。因此,他决定打造一个自己理想中的版本。他们最早的火车头客户,是急需对海量街景图片进行标注的自动驾驶公司Cruise。Scale AI恰好卡位,乘上了第一波计算机视觉驱动的自动驾驶浪潮。当这波浪潮趋缓,大语言模型时代接踵而至,所有公司都需要进行大规模的人类反馈强化学习,而Scale AI再次完美卡位,为自己找到了新的增长引擎。如今,许多面临转型的创始人,也能凭借敏锐的洞察力,在身边发现机会。一位创始人苦寻方向半年无果,最终在自己父母的牙医诊所里找到了灵感,打造了一款牙医诊所的后台AI系统,如今周增长势头迅猛。这正是技术型创始人孤注一掷、追逐微光,并最终找到广阔市场的典型例证。

2024年的浪潮与退潮:垂直AI、编程与机器人

语音AI的垂直化繁荣

语音AI无疑是2024年最具前景的垂直领域之一。一个常被问及的问题是:最终会是一个赢家通吃的基础设施市场,还是一个由上百个垂直应用组成的生态?答案很可能是两者兼有。我们谈到的客户服务,本身就包含无数迥异的垂直场景。一家航空公司的客服智能体,与一家银行或一个B2B SaaS公司的需求截然不同,其背后的工作流也千差万别。会有杰出的语音AI基础设施公司,让构建应用变得轻而易举;同时,也会有成百上千个深入特定行业的垂直应用。这就像Stripe在支付领域的成功,并未吞噬所有依赖支付的互联网应用一样。

AI编程引爆生产力革命

2024年同样是AI编程彻底爆发的一年。绝大多数YC创始人已在使用Cursor等AI集成开发环境,而Devin则证明了大规模编程任务可以被完全自动化。Replit Agent持续进化,让非技术人员也能够在通勤路上创建应用,实现了技术的平民化。更令人兴奋的是,像Anthropic的Artifact这样的工具,允许产品经理通过与Claude对话构建可交互的前端原型,直接为工程师团队提供完整的工作版本。“一人成军”的生产力已成为现实。这甚至正在改变初创公司的招聘模式。一些刚刚获得种子轮融资的创始人,不再急于招聘传统的职能性高管,而是让自己的软件工程师利用大语言模型编写更多自动化流程。这类创始人正在寻觅更具“AI原生”能力的工程师——他们不仅代码功底扎实,更擅长提示工程,能精准判断AI输出的代码是否正确。在面试中,观察候选人与AI工具的配合,甚至已成为一种新的考核方式。这预示着编程面试本身将发生变革,不再禁止使用AI工具,而是直接衡量候选人在使用工具时能达到的绝对产出上限。

机器人:软件已醒,硬件尚存挑战

机器人的ChatGPT时刻虽未完全到来,但已曙光初现。自动驾驶出租车在旧金山的全面商用化,让普通居民每天都亲身体验着机器人技术的成熟。我们今年见到的硬件创业者比以往任何时候都多。一家名为Weave Robotics的公司计划在2025年以约6.5至7万美元的价格,交付一款真正能在家中使用的机器人。当前的思路是,大语言模型可以作为机器人的“意识”,理解指令和与环境互动,而下层的具体动作执行,如叠衣服,则像是被“意识”调用的一个工具。这被称为“语音-语言-行动模型”。当前最大的挑战在于硬件。如果初创公司能够只在软件和AI层面创新,并使其运行在廉价的通用硬件上,那将是巨大的机遇;反之,如果硬件和软件必须深度耦合,那么像特斯拉这样软硬一体的巨头将拥有巨大优势。许多初创公司正试图在特定场景下,创造性地在通用硬件上运行模型,这仍处于早期阶段。

AR的艰难破局

2024年也有失意者,比如增强现实。我们在年初曾头戴Apple Vision Pro兴致勃勃,但一年过去,AR并未起飞。其核心症结在于物理定律的制约——在轻便小巧的形态中塞下足够强大的计算和光学元件,是极为艰巨的工程难题。鸡与蛋的难题依旧存在:没有足够的硬件装机量,开发者缺乏构建杀手级应用的动力;而没有杀手级应用,消费者又缺乏购买昂贵硬件的理由。目前最实用的功能,似乎是将它作为一个巨大的虚拟显示器用来观影。一个有趣的尝试是Meta的Ray-Ban智能眼镜,它虽无显示功能,但其出色的音频和语音交互能力,让人可以随时与ChatGPT或Claude展开对话,成为一种不错的移动学习伴侣。

旧金山与硅谷的回归

最后,2024年的另一个主题是“回归”。YC回到了线下,在旧金山举办了盛大的现场演示日。在共济会中心,1200名投资人齐聚一堂,创始人与投资人的比例高达1:10,现场的能量和活力是Zoom永远无法复制的。它重新成为了硅谷的风险投资人的年度聚会。同样,在度过“远程办公将永久持续”的幻象期后,从成长期到巨头的企业都在急切地推动员工回流办公室。旧金山这座城市本身也在复苏。随着选举尘埃落定,新的市长和趋于温和的市议会多数派为扭转城市的颓势带来了希望。正如创业一样,我们总会高估一年内能做到的事,却低估十年内可能发生的巨变。修复一座城市可能需要十年甚至二十年,但我深切希望,旧金山能继续成为吸引全世界最聪明头脑的灯塔,并持续向前发展。