初创公司的好消息:大企业做不好 AI

摘要
本期《光锥》(The Light Cone)节目深入剖析了一个令初创创始人振奋的现象:大型企业在 AI 落地方面普遍表现糟糕,而这恰恰为初创公司创造了前所未有的机遇。节目缘起于社交媒体上广泛流传的"95% 的 AI 项目失败"的说法,YC 合伙人 Jared 仔细研读了引发这一论调的 MIT 研究报告后发现:报告的结论与推文所暗示的截然不同——失败并非 AI 本身的问题,而是大企业内部构建软件的能力缺陷所致。节目通过 Tactile、Greenlight、Castle AI、Reduct 等多个 YC 孵化公司的真实案例,揭示了大企业为何在 AI 上屡屡碰壁:内部 IT 系统落后、咨询公司缺乏技术深度、工程团队对 AI 缺乏信念、组织政治内耗严重。与此同时,报告数据表明,当企业选择外部供应商(即初创公司)时,成功率远高于自行开发。节目还探讨了初创公司如何在大企业中找到"冠军"(champion)、如何用"做不规模的事"(do things that don't scale)赢得合同,以及 Andrej Karpathy 关于 AI 智能体(Agent)被过度炒作的访谈如何被误读。最终,节目传达的核心信息是:如果你是真正优秀的创始人,你不应被"5% 成功率"吓退——因为你完全有可能成为那 5%。
正文
"95% 的 AI 项目失败"——推文说了什么,研究又说了什么
节目开场,主持人表达了近期被 AI 网红(AI influencers)激怒的感受——他们在 X 和 YouTube 上声称"95% 的 AI 项目是失败的",以此证明 AI 是骗局。Jared 仔细阅读了被这些人挪用(grifting with)的 MIT 研究报告后指出:推文版本极具误导性。他曾与一群大学生交流,对方仅凭推文摘要便得出结论——"YC 谈论的 AI 初创公司一定都不行,因为研究说它们全都失败了"。然而,Jared 越深入阅读原始报告,越发现它实际上印证了节目此前关于 AI 智能体(AI Agent)在真实世界中运行方式的讨论,以及哪些方法和类别确实在奏效。
大企业为何做不好 AI:内部 IT 与咨询公司的双重困境
Gary 提出了一个直观的心智模型:当企业试图推进 AI 项目时,通常依赖内部 IT 团队,或者当内部 IT 不堪用时,转向安永(Ernst & Young)、德勤(Deloitte)等大型咨询公司。然而,任何使用过企业内部 IT 系统的人都知道——内部系统通常很糟糕。而如果转向咨询公司,问题不仅没有减少,反而加倍了。Jared 指出,报告的结论对他而言毫不意外:世界上大多数被构建出来的软件都非常、非常糟糕。
Gary 以苹果公司为例——这家拥有无限资本和全球最顶尖人才的公司,其日历应用(Calendar App)依然频繁出现奇怪的 Bug。如果苹果都做不好一个日历应用,普通公司、内部 IT 系统,甚至安永或德勤又怎能例外?这些机构中的人或许出于善意,但产出的大多数软件质量堪忧。
Diana 补充了组织政治的维度:大企业中部署复杂软件通常需要多个团队协同使用,而跨团队协作必然伴随政治博弈(political battles)和地盘之争(turf wars)。企业转向咨询公司的部分原因,正是希望安永这样的机构能充当调解者——与数据科学团队、客户支持团队、IT 团队逐一沟通,整理出各方需求的文档,形成某种共识规格。这一步骤虽有价值,但下一步——实际执行——咨询公司缺乏技术专长来实现软件;而企业内部即使有软件团队,系统也往往老旧且孤立(siloed),需要同时具备外部咨询的协调能力和内部的软件构建能力。最终产物往往沦为"委员会设计的骆驼"——一匹由委员会设计的马(a horse designed by a committee),即各方妥协下的四不像。
Tactile:银行内部耗时数年的项目,初创公司用 REST API 搞定
Gary 和 Jared 介绍了他们曾合作的 Tactile 公司,该公司为银行构建高级商业决策引擎(business decision engine),可在实时处理中帮助银行完成 KYC(了解你的客户,Know Your Customer)和 AML(反洗钱,Anti-Money Laundering)审查——例如,当有人申请贷款时,系统可以即时判断其信用状况和业务规则合规性,每天在规模上执行数百万次决策。花旗银行(Citi Bank)和摩根大通(JP Morgan)曾试图自行构建类似软件,每个案例都耗时 3 至 5 年、投入数千万美元。而 Tactile 仅用一小部分预算和远少的时间,就构建了一个实时决策的 REST API,并可将最新 AI 模型接入其中。
Greenlight:安永花一年没做成的 AI 系统,初创公司做成了
Jared 分享了 Greenlight 的故事——这家同样向银行销售 AI 系统的公司,在试图向某银行推销时遭遇了阻碍:该银行与安永有长期合作关系,而安永据说为该银行构建所有软件,这在业内并不罕见。银行表示信任老伙伴安永,让安永来构建 AI 系统。结果安永花了一年时间,系统完全无法运行。银行这才回头找 Greenlight,如今 Greenlight 的系统已在该银行全面部署且正常运转。
Jared 特别指出了报告中一个关键数据:在所调查的项目中,三分之二是企业自行开发或借助咨询公司开发的项目,只有三分之一是向外部供应商购买产品的项目。然而,企业选择外部供应商时的成功率远高于自行开发的成功率。这组数据本身就是对"AI 是骗局"论调的有力反驳——问题不在于 AI,而在于谁来构建。
为什么只有少数人能做好 AI 产品
Gary 回到苹果的类比,提出了更深层的洞察:真正能做出可用产品的人极其稀缺——你需要既擅长产品又擅长工程的通才(polymaths)。世界上有很多出色的工程师,但他们可能整天待在"编码洞穴"(coding cave)里,无法理解银行职员的工作方式;而另一端,真正理解业务领域的人往往不会写代码、不懂技术、无法设计和交付产品。因此,在每一个流程、每一个应该存在却不存在的烦人系统中,都有一个"初创公司形状的空洞"(startup-shaped hole)。
Diana 进一步指出,这是一种极为罕见的技能组合:既拥有最前沿的 AI 理解力和产品品味(product taste),同时又具备足够的同理心去理解人类业务流程并将其转化为产品。
Castle AI:不是贴上 AI 标签就够了
Diana 分享了 Castle AI 的案例。该公司同样面向银行,构建 AI 抵押贷款承销系统(AI mortgage underwriter)。当 Castle 进入银行的销售对话时,常常需要与现有 incumbent 供应商进行"烘焙对决"(bake off)——即竞标对比测试。银行之所以继续信任老供应商,是因为长期合作关系。但有趣的是,这些老供应商的 AI 产品往往只是在原有系统上"贴了一层 AI"(AI slapped on top),缺乏从底层原生构建(native from the beginning)的深度和产品品味。Castle 正是凭借这种原生 AI 架构的优势,在仅一年的时间内就拿下了多家大型银行。
Reduct:154 天签下大客户,靠的是做不规模的事
Diana 介绍了 Reduct 的案例——该公司刚宣布完成 B 轮融资。令人震惊的是,他们在 YC 批次结束后仅 154 天就签下了一家大型风投公司(fan company,应为金融公司/大型企业的 ASR 误差)。这家公司通过 YC Launch 发现了 Reduct 并主动联系。
Reduct 专注于 AI 文档处理(document processing for AI)。该客户此前已花费数年尝试各种内部解决方案——开源方案、AWS Textract、各类 OCR(光学字符识别,Optical Character Recognition)方案——均未达标。最终,Reduct 凭借产品卓越性(product excellence)赢得了这笔大单。
然而,Reduct 的成功并非一帆风顺。他们必须与客户内部团队竞争,并巧妙地应对复杂的组织政治——MIT 报告确实提到了这一点。Diana 强调,这一切的秘诀正是 YC 的经典方法论:"做不规模的事"(do things that don't scale)。Reduct 与客户内部的"冠军"(champion)建立了深厚的友谊,这位内部支持者看到了这些聪明年轻人的热情,愿意为他们冒一次险。Diana 认为,这是 YC 创始人向大企业销售的常见模式——创始人的雄心和乐观具有感染力,能让人愿意给予机会;而一旦获得机会,他们往往超越预期。
如何在大企业中找到你的"冠军"
Gary 补充了一种特定的大企业员工原型:那些一直梦想创业但永远不会真正付诸行动的人。他们太过厌恶风险(risk-averse),因此可以通过支持一个令人兴奋的初创公司来间接体验创业之旅。如果你找到这样的人作为你的冠军,他们真心希望你成功,因为你的成功让他们感觉自己也在创业。
Diana 深以为然:"找到那些想要滋养内心那个曾经梦想创业的小孩的人。"
Gary 还给出了一条关于创始人形象的建议:许多年轻创始人试图伪装成熟——穿西装、照搬微软主页的设计——但他们不该这么做。保持真实(authentic)就好。做一家初创公司本身没有问题,重要的是展现聪明和专业,而非复制大企业的繁文缛节(formalism)。
Jared 分享了另一个实用策略:找到那些公司被大企业收购的创始人,让他们成为你的冠军。以 Triplebyte 为例,他们之所以能与苹果合作(当时几乎没有招聘公司在与苹果合作),全靠一家被苹果收购的 YC 公司 Q(由 Robbie Walker 和 Danny Gross 创立)的引荐。Jared 还回忆起通过一位将公司卖给 Oracle 的创始人,拿到了 Oracle 的试点项目——这位创始人不仅帮助他们走完采购流程,还提供了完整的内部政治攻略和逐步操作手册(step-by-step playbook)。
Gary 感慨,这是硅谷特有的"传递善意"(pay it forward)文化,其价值无法在任何研究中被量化。
企业对 AI 的需求远超想象,且更愿意赌初创公司
Jared 指出了报告中被推文版本完全忽略的另一个乐观发现:企业对采用 AI 的需求极其旺盛,而且比以往更愿意在新创公司上下注。所有这些销售技巧固然有用,但如今向一家大型科技公司(FANG company)推销 AI 智能体,确实比当年 Jared 运营 Triplebyte 时容易得多。
然而,Gary 将话题拉回报告的核心逻辑:企业当然更愿意从成熟的软件公司或融资充足、存在多年的后期初创公司购买解决方案——因为风险更低。但根本问题在于,这些公司造不出产品。许多 YC 合伙人都认为,原因在于大企业的工程团队充斥着本身就不相信 AI 的人——他们不使用代码生成工具(codegen tools),认为一切都是过度炒作,当 MIT 研究说 AI 是泡沫时兴奋地转发——因为他们内心渴望相信这个叙事。但对公司而言,后果是致命的:如果你的工程师不相信 AI,你怎么可能造出真正有效的产品?
对初创公司的连锁效应(knock-on effect)则是:如果你能造出真正有效的产品,大企业会主动找你——因为他们别无选择。内部造不出,成熟公司也造不出。初创公司因此获得了前所未有的机会。
对不信 AI 的工程师:试试再说
Jared 对那些被激怒的工程师发出了直接邀请:讽刺的是,你真正需要做的只是尝试一下。如果你会写代码,无论你是出色的工程师还是普通工程师,只要认真试用这些工具、投入一个真实项目——不必是主业,可以是副业——你会感到惊讶。他提到 YC 一个月前举办了"氛围编程家长之夜"(vibe coding dad's night),参与者甚至不是技术人员——一位房东用氛围编程(vibe coding)为租户做了一个查看租金缴纳情况的工具。这些工具能将 10 倍工程师变成 100 倍工程师,将 1 倍工程师变成 10 倍工程师——这是一份礼物,但它需要克服人们内心真实的抵触情绪。
Karpathy 的访谈为何被误读
Jared 提到上周另一个"等待过度炒作叙事"的例子:Andrej Karpathy 在 Dwarkesh 采访中的言论。推文版本是"Karpathy 说智能体被过度炒作、做不了事"。但 Jared 实际听了采访后发现,Karpathy 的真正观点是:你不能只给智能体一个提示词(prompt)就指望它一次完美完成所有工作——你仍然需要做大量工作来提供正确的数据、构建正确的上下文、进行评估(evals)以及搭建实际工具。Jared 的解读是:这对初创公司和任何能构建软件的人来说是绝佳机遇——仍然有大量东西等待被构建。这几乎是一个罗夏测试(Rorschach test):如果你从根本上想相信一切被过度炒作,你会读出"AI 专家确认一切被过度炒作";但如果你真正聆听他在说什么,就会发现有大量机会去构建优秀的工具——这些 AI 系统是工具,你只需要帮助它们更好地工作,而非指望它们毫无辅助地成为绝对魔法。
软件需要被重写为 AI 原生——这是创始人的巨大机遇
Diana 总结道:令人兴奋的是,有大量机会将所有这些系统重写为 AI 原生(AI native),因为软件需要被彻底重写才能与 AI 协作——这对创始人来说就是大量的机会。
Jared 补充了报告中另一个关于"为什么企业市场对初创公司如此巨大"的有趣发现。他直接引用了一位企业采购者的话:"我们目前正在评估五种不同的生成式 AI 解决方案(gen AI solutions)。但一旦我们在训练一个系统上投入了时间,转换成本(switching costs)将变得不可承受。"这位发言者是一家 50 亿美元金融服务公司的 CIO。Jared 指出——这就是护城河(moat)。那些担心"聊天机器人包装器"(chatbot wrappers)没有护城河的人,答案就在这里。
结论:不要被统计数据吓退
节目最终传达的信息是:AI 末日论网红们一直在误导你。AI 确实难以实际落地——难到只有 5% 的项目能成功。但同时,如果你是真正优秀的初创公司创始人——YC 的录取率现在已经低于 1%——节目给出了大量属于那 1% 的创始人的例子,他们进而成为那成功实施的顶部 1%,因为他们是真正最优秀的产品人和工程师。归根结底,这关乎那些既真正精通技术,又是通才的人——他们理解他人,能理解那位 50 亿美元金融科技公司 CIO 真正想要什么。这就是好消息。你不应该看着这些统计数据说"我不可能成为那 5%"。如果你确实非常优秀,你绝对可以做到——YC 有无数这样的例子。