当下构建AI创业公司的真相

cover

摘要

这是Y Combinator播客《光锥》(The Light Cone) 的首期节目,由四位YC集团合伙人 (Group Partner) ——Gary、Jared、Harge和Diana——共同主持。节目从狭义相对论中"光锥"的概念出发,探讨技术的过去与未来,聚焦于AI正在深刻改变几乎每一个社会领域和商业活动的现实。2023年夏季批次中,约50%的YC资助公司涉及大语言模型 (Large Language Model, LLM),这并非YC的预设偏好,而是最聪明的创始人用行动投票的结果——他们认定AI是构建最大公司的高风险高回报领域。本期深入讨论了:为什么年轻创始人在AI领域特别有优势;哪些"无聊"的垂直领域恰恰蕴含巨大机会;AI焦油坑 (Tarpit) 创意的陷阱;AI副驾驶 (Co-pilot) 的真实困境;开源微调 (Fine-tuning) 模型的前景与局限;AI安全与数据隐私的新兴市场;专有领域小模型的竞争力;以及"ChatGPT包装器" (GPT Wrapper) 这个标签为何如同当年的"数据库包装器"一样荒谬。最终,嘉宾们回归到一个核心观点:在AI领域寻找创业机会时,不要被光鲜亮丽的想法吸引,而要深入泥潭——因为"有污泥的地方就有金子" (Where there's muck, there's brass)。

正文

《光锥》的诞生

欢迎来到《光锥》的第一期节目。主持人分别是Gary、Jared、Harge和Diana,他们都是Y Combinator的集团合伙人,与世界上最优秀的创始人共事。Jared解释了节目名称的由来:在狭义相对论 (Special Relativity) 中,光锥是光从闪光点向外传播的路径,在时间维度上同时向未来和过去呈锥形展开。这个节目立足于当下,但将探讨技术的过去与未来——这正是"光锥"这个名字的灵感来源。

AI席卷一切

四位合伙人共同观察到,AI正在渗透到社会的几乎每一个层面——每一笔商业交易、每一项与计算机相关的活动,都在经历一轮新技术的注入。这种趋势在他们资助的创业公司中表现得尤为明显,这也是他们如此兴奋的原因。

50%的YC公司从事AI——这不是预设偏好

Gary问及当前资助的公司中有多少涉及大语言模型。Diana透露,2023年夏季批次接近50%。很多人看到这个数字后会认为YC一定是因为某种"AI论题"才大量资助AI公司,觉得做AI公司更容易进入YC。然而事实并非如此。YC的运作方式是:聪明的创始人带着他们想做的项目来申请,YC资助的是聪明的人,而非特定的方向。因此,一半批次在做AI这件事说明了一个更有意思的现象——最聪明、最有抱负的创始人正在用脚投票,他们认为AI是当下构建最大公司的高风险高回报 (High Beta) 领域。

这一次,AI是真的

AI经历了多次浪潮和多个"AI寒冬" (AI Winter),但这一次是真实的。GPT-3.5和GPT-4在大量任务上的表现令人震撼,吸引了大量聪明人的关注。当最聪明的人开始认真对待并投入建设时,大规模的划时代公司正在此刻诞生。

年轻创始人的独特优势

一个有趣的趋势是,越来越多的大学生为了从事AI而辍学。通常在面试中,合伙人会问"着什么急?为什么不先毕业?"而创始人的回答是:"这可能是一次千载难逢的机会。"四位合伙人也表示认同。更令人兴奋的是,在这个领域,年轻创始人有着独特的优势——没有人拥有四年的LLM经验,所有人都站在同一条起跑线上。如果你学得快,就能和其他所有人达到同样的水平。

提示工程开发工具的兴起

Diana观察到,提示工程 (Prompt Engineering) 的开发工具正在兴起——将不同的提示链接在一起、测试提示、观察二阶效应等。许多大学生正在把玩提示模型、观察输出,这为他们提供了一个极易上手的创业方向:直接构建自己想要的工具,而这些工具正在成为所有开发者的标准。

无聊的工作流自动化才是真正的机会

虽然媒体头条都在讨论通用人工智能 (AGI) 、多模态AI和AI生成视频等炫酷话题,但在YC批次中真正起飞的项目要平凡得多——主要是工作流自动化 (Workflow Automation)。具体来说,是找到那些由人类执行重复性任务的场景——搜索信息、填写表格——然后用LLM替代。世界上有大量隐藏在后方的办公室中的岗位,人们的工作就是阅读、摘要、将数据从一个系统重新录入另一个系统,格式还略有不同。LLM简直是为此而生的——然而,YC收到的这类申请并不多。如果你正在寻找AI创业想法,这就是一个值得深入探索的方向。

Sweet Spot的案例:从食品卡车到政府合同

上一批次有一家叫Sweet Spot的公司,最初的想法与食品卡车点餐有关。他们很快转向寻找新方向,发现了一个朋友的工作就是为政府承包商刷新政府网站、寻找可竞标的合同并提交提案。他们意识到:这不正是LLM完美胜任的工作吗?于是他们用LLM自动搜索政府合同并提交提案,一经推出就获得了可观的吸引力——自动化让寻找政府合同变得容易得多,软件帮你完成了繁琐的工作。

"有污泥的地方就有金子"

这引出了一个核心原则:看似无聊的东西实际上可能是了不起的生意。Paul Graham (PG) 曾在一篇文章中引用了一句古英语谚语:"Where there's muck, there's brass"——你可以在出人意料的地方找到宝藏。关键在于你必须深入垂直领域,解决一个非常具体的痛点问题。

AI焦油坑:闪亮的陷阱

所谓焦油坑创意 (Tarpit Idea),就是从外面看起来非常闪亮、非常有吸引力的创业想法,大量创始人纷纷投入,但一旦深入才发现它实际上并不是好的创业方向——而此时你已经深陷其中、难以脱身。因为焦油坑不断吸引一个又一个创始人,他们都在同一个陷阱中挣扎。YC因为能看到所有申请,所以很容易发现同一个批次中有500人申请同一个想法——但这些创始人彼此并不知道有499人也陷入了同一个焦油坑。AI领域的焦油坑尤其棘手,因为技术太新,我们还无法在事后才识别它们。

AI副驾驶的困境

一个非常常见的焦油坑是AI副驾驶 (AI Co-pilot)。现象非常特殊:潜在客户对副驾驶有大量需求,所以很容易获得潜在客户线索,甚至很容易让人预付款项。但真正困难的是让他们实际使用副驾驶——因为他们并不知道自己需要它来做什么。他们只是听说AI副驾驶可能改变软件的未来,所以"我们也得有一个AI副驾驶",但他们并不清楚自己的客户会怎么用。或许最终他们会找到产品市场契合 (Product-Market Fit),或许大多数人根本不需要AI副驾驶。Diana给这些公司的建议来自PG的另一篇文章:如果你试图把技术卖给某人而对方不买,试试直接用这项技术构建一个竞争产品——如果你坚信某家金融科技公司应该有副驾驶,那为什么不直接用副驾驶作为核心体验来构建那家公司,看看能否超越对手。

聊天界面并非最佳方案

Jared对聊天界面 (Chat Interface) 始终不太看好。聊天将太多负担放在了用户身上——要求用户知道如何与计算机对话。虽然未来5到10年大家会更习惯这种交互方式,但目前更容易实现的方式是:用LLM执行人类本应完成的知识工作,然后将结果打包进用户已经熟悉的界面——无论是移动应用还是网页应用。LLM更像是一种嵌入式的增强能力,让软件突然拥有了强大的功能,但你不必改变用户使用软件的方式。这与历史上每一轮技术热潮中的现象类似——公司被问到"我们的AI战略是什么",就像当年被问到"我们的区块链战略"或"移动战略"一样。短期内很容易卖一个让他们勾选框的东西,但最终你必须真正为他们创造价值,否则产品不会持久。

卖铲子的问题

在淘金热中,卖铲子和工具的人往往赚得更多。但AI领域的问题在于,许多人还没有开始挖金子——技术太新,终端应用甚至都还没有找到产品市场契合,某种程度上是盲人给盲人引路。一些开发工具公司卖给AI公司,再由AI公司卖给Fortune 100企业,结果6个月后Fortune 100企业因为现有的巨头(如IBM、Salesforce)也加入了LLM技术而转回 incumbent,开发工具公司突然发现自己的客户流失了大半。这种快速演变令人震惊。

开源模型微调服务的前景与局限

2023年一个非常流行的创业方向是提供开源模型微调 (Fine-tuning) 服务。最初的需求驱动力是成本——ChatGPT太贵,人们想要更便宜的替代方案,所以"我们帮你微调一个开源模型,会便宜很多"这个推销话术很容易获客。但随着所有模型的成本持续下降,仅靠"更便宜"已经不足以留住客户。需要做到"更好"而非仅仅是"更便宜"。Diana认为更有持久力的方向是:当企业需要将模型定制到私有数据集上——比如医疗或金融科技领域无法公开的数据——而他们又没有专业团队来做微调。YC资助的Credle就在做类似的事情。

数据隐私与AI安全的新兴市场

Harge提到了数据隐私方面的担忧:企业是否担心将数据交给OpenAI?每一次重大技术革新都会重置竞争格局。正如10到15年前云计算 (Cloud) 崭露头角时催生了云安全行业和CrowdStrike等公司一样,LLM领域也在出现第一波网络安全公司。例如Prompt Armor——它包装你的API调用,发现了一个关键问题:如果你用私有数据对LLM进行微调或训练,实际上可以通过对话让模型输出你的私有数据。他们有解决方案来阻止这种情况。这实际上正在创造一个全新的LLM网络安全行业,正如云计算催生了云安全一样。Diana补充道,企业内部控制哪些LLM可以访问哪些数据、谁有权限,是一个非常值得构建软件的成熟领域。

专有领域小模型的竞争力

另一个令人兴奋的方向是:更小但针对特定用途训练 (Purpose-trained) 的模型。例如,将Llama这样的开源模型定制后在本地机器上运行推理。当你在特定领域和目标数据上定制训练后,它的表现将优于通用模型——通用模型是在所有人类语言和所有任务上训练的,但如果你要构建解析SQL查询的语言模型,只需针对SQL查询专门训练即可。YC资助的AMA公司就在加速本地LLM的开发流程。Diana分享了一个令人惊讶的发现:一些构建编程类副驾驶的公司(这是一个确实在奏效的用例,大大加速了编程工作流),实际上使用的是较老的GPT模型,甚至不需要最新的。她问为什么——答案是:特定领域(无论是硬件还是软件)的词汇量远小于整个人类语言,所以较老的模型就能产生足够好的结果。这就是开源定制模型能在特定领域胜过大型通用模型的原因。

GPT-4作为原型工具:FPGA类比

Shopify的Tobi Lütke分享了一个重要的观点:将GPT-4等最强大的闭源模型视为原型工具——你用这些模型做的任何提示,都可以通过少量训练让自己的模型完成同样的任务。这就像硬件开发中的类比:用FPGA(现场可编程门阵列)进行原型设计——FPGA非常昂贵,但当你确定了正确的架构后,再做电路设计和定制ASIC。目前,大型语言模型就像你的FPGA——用GPT-4原型验证,当你定制训练后,就相当于做了超高效的定制芯片——无论是Shopify的编程助手还是硬件软件领域,这成为了你训练和定制的专属模型。这个模式正在浮现。

从未有过如此多的创业机会

Gary感叹道,从没经历过有如此多潜在创业想法可以构建的时刻。Diana和Harge完全认同——上一个批次中所有转型的公司就是明证。很多人不知道的是,许多进入YC的公司在资助一个月内就开始寻找新想法,因为原来的方向行不通或失去了兴趣。通常找到一个好的创业想法并不容易,但上个夏天简直太容易了——好的创业想法遍地都是,你甚至会绊倒它们。Harge发了一条推文称这是他整个YC职业生涯中创始人最快找到好想法的批次,该推文相当走红。

"ChatGPT包装器"标签的荒谬性

大约一年前,"GPT包装器" (GPT Wrapper) 这个说法开始流行。第一批AI创业想法都是在ChatGPT之上构建的生成式AI——自动生成营销文案、自动生成创意内容等。这个标签暗示OpenAI会自己做这些功能、发布应用商店、夺走所有价值,这些包装器都会消亡。然而,Diana指出了一个绝佳类比:所有的SaaS软件本质上都是MySQL包装器——SaaS产品的第一个版本基本上就是一个CRUD应用,你不过是在MySQL之上建了个网站。人们回顾"GPT包装器"这个词时,会像现在看"数据库包装器"一样觉得可笑。

聊天界面的问题与优秀UX的永恒价值

Jared再次强调聊天界面是错误的。价值会累积到真正优秀的用户体验 (UX) 身上——好的文案、交互设计、信息层级、让用户一进来就知道该做什么。构建软件是一门手艺,这种手艺是永恒的,超越你是否使用了LLM。SaaS软件不是MySQL包装器,AI软件也不是GPT包装器。

如何区分十亿美元公司与GPT-5碾压对象

Harge提出了一个关键问题:如果你想在LLM之上构建公司,如何区分一个可能成为十亿美元公司基础的创意,和一个很可能被GPT-5碾压的创意?Diana认为,如果一个创始人在做的事情太泛化、没有解决用户的具体需求,那就很危险。"把数据扔进来,我们给所有东西做自动化"这种泛化方案很难与基础模型竞争。但如果是"把销售日志数据给我们,我们为销售人员生成建议的下一步行动",或者"把所有合规检查清单给我们,帮你通过HIPAA合规",或者"把所有政府表格数据给我们进行处理"——这些都非常具体,包含大量业务逻辑 (Business Logic)。正如SaaS时代一样,大量应用的价值正是累积在那套高度定制化的业务逻辑上,这才是公司的护城河。

语音AI代理与重新想象软件

随着AI走向多模态,事情将变得更加有趣。已经出现了语音AI应用充当销售代表的案例。一个寻找创意的好方法是:审视现有软件,用AI的力量重新想象它。如果Salesforce今天从零开始,它肯定不只是做一个CRM——它会帮你找到潜在客户、帮你打电话、帮你安排会议,甚至帮你实现产品的第一个版本。AI时代可以构建的软件范围如此之大。

AI代理的恶意使用与开源AI的必要性

YC资助了多家为小型企业构建AI语音代理 (Voice Agent) 的公司——花店、空调维修商需要接听大量预约电话。然而,合伙人Paul Buchheit对此感到担忧:未来可能出现大量恶意AI代理试图行骗的世界,我们需要自己的防御性AI代理来保护我们。这也是为什么Diana大力倡导开源AI——如果世界上只有一个超主导地位的通用人工智能 (AGI),它完全闭源、由一家公司拥有、只向最高出价者开放,那是极其危险的。想象一下,你去看医生,对面是花了重金购买访问权的保险公司,你根本无法对抗那个不可穿透的AGI。我们需要AI层面的公平——不仅最大的公司应该拥有最强大的AI,所有消费者都应该从底层拥有同等的技术访问权。这是抵御暴政的最佳保险。

NeurIPS大会与AI研究者的创业浪潮

Diana参加了2023年12月的NeurIPS大会,感受到了令人难以置信的能量——参会者超过1万人,接收论文超过3000篇,而2017年仅有约600篇,2010年时还只是在一个滑雪小屋里、大约100篇论文。增长是指数级的。一个有趣的现象是:大量研究者想要创办公司。GPT时代的基石——2017年的论文《Attention Is All You Need》出自Google一个试图降低机器翻译成本的团队,他们发明了压缩数据的方法,成为了GPT的Transformer模型基础。该论文8位作者中有7位创办了不同的公司,这些公司的总估值超过60亿美元。这激发了一批新的创始人——Diana接触了很多AI研究者,他们原本并不想创业,但现在纷纷询问"如何将我的论文变成一家公司"。当YC在NeurIPS举办活动时,报名人数是容量的3倍,站满了人。Diana称这是新的"家酿计算机俱乐部" (Homebrew Computer Club)。

YC回归本源

Diana认为这某种意义上是YC回归本源。YC创立时,互联网非常新,在上面构建东西的主要是技术专家——因为当时建网站和做好软件确实很难。随着建网站和软件变得商品化,更多人进入了这个领域。而现在,构建最有趣东西的人又回到了最硬核的研究者和技术专家,因为真正的新技术正在被发明——不再是仅用商品化技术做商业模式创新。

极客、拖把与社会病理者

Harge提到了一篇在Hacker News上看到的经典文章《极客、拖把与社会病理者在亚文化演进中》 (Geeks, Mops, and Sociopaths in Subculture Evolution)。这个模式不断重演——始终是极客们无论外界如何看待都沉浸在技术前沿。Steve Wozniak曾说:"我们创办苹果电脑时,从未想过它会成为一家公司——我们只是想要自己和朋友们拥有电脑。"某种意义上社会病理者随后出现,开始从涌入场景的人身上变现,然后周期回归重复。这就是为什么要在新周期的起点——而AI正是这样一个时刻。

不要被光鲜吸引,去污泥中寻金

不要轻易否定AI,但也不要被闪亮的新事物吸引。相反,要去寻找污泥——因为"有污泥的地方就有金子"。这可能是一个很好的结尾,也是《光锥》第一期的核心信息。