现在可以用 AI 构建的创业想法

摘要
本期 Y Combinator 的 Light Cone 节目由多位合伙人共同讨论:在 AI(尤其是大语言模型)能力突飞猛进的当下,哪些曾经不可行或效果不佳的创业想法现在终于迎来了窗口期。Harj 以自身经营招聘创业公司 Triplebyte 的经历为例,说明过去需要数年积累标注数据才能做好的工程师评估,如今借助 LLM 第一天就能实现——这正是 Meror 等新锐招聘公司迅速崛起的原因。Gary 则聚焦教育领域,指出超个性化学习(Hyperpersonalization)这一教育科技的圣杯终于可及,Revision Dojo 和 Speak 等公司已展现出强劲的用户增长。讨论进一步延伸至:三方/四方市场如何因 AI 压缩为两方市场、消费级 AI 产品的商业模式变革(从"卖软件"转向"替代真人服务"的定价逻辑)、护城河(Moat)的真正来源、Google 与 OpenAI 之间的平台竞争与平台中立性问题、全栈创业公司(Full Stack Startups)为何在上一轮失败而如今有机会复兴,以及 Replicate、Ollama、Deepgram 等基础设施公司如何在漫长低谷后迎来爆发。节目最后提出一个元观点:前 AI 时代"先卖再造、精益创业"的经典教条已过时,当今最有效的创业路径是追随自身好奇心、站在技术前沿,用正确的提示词、数据集和评估方法即可创造出令人惊叹的产品。
正文
基础设施仍待建设
节目开场,嘉宾们便达成共识:围绕 AI 部署和智能体(Agent)使用的工具链与基础设施仍有大量空白。如果你身处未来前沿、持续探索最新技术,就很可能"撞上"一个绝佳的创业想法——只需运用恰当的提示词(Prompt)、数据集、一点独创性、正确的评估(Eval)和一点品味,就能获得如同魔法般的输出。Gemini 2.5 Pro 带来了百万令牌上下文窗口(Million Token Context Window),这类新能力正在催生大量此前不可能实现的创业构想。
招聘市场的重构
Harj 回顾了自己经营 Triplebyte 近五年的经验。2015 年前后,招聘创业公司曾是一个热门赛道,核心思路是将市场模型(Marketplace Model)应用于招聘——特别是工程师招聘。Triplebyte 的 thesis 是:不开放任何人进入市场,而是构建一个精选市场(Curated Marketplace),通过技术面试评估工程师并提供丰富数据。然而这一切在 LLM 时代之前完全依赖人工:他们花了数年自建软件、进行数千场技术面试来挤压每一个数据点,最终才积累了足够的标注数据集(Label Dataset)来运行机器学习模型。更复杂的是,Triplebyte 本质上是一个三方市场(Three-sided Marketplace):公司需要招人、工程师需要工作、还需要签约面试官来面试工程师——三方的协调成本极高。
而如今,AI 代码生成模型(AI Codegen Model)可以胜任代码评估,像 Meror 这样的公司在第一天就能用 LLM 完成评估环节,省去了构建标注数据集的数年时间。更重要的是,LLM 让从工程师扩展到分析师等其他知识工作者变得轻而易举——过去每拓展一个领域都要重建标注数据集,如今只需换一个 prompt。
Gary 提出了一个有力的思维框架:去审视世界上所有的市场,问一句"LLM 会如何改变这个市场?"例如,多邻国(Duolingo)这样的两方市场可能正面临压力,因为用户也许会直接用 AI 来练习外语对话。
创始人的心理挑战与 Instacart 式机遇
Harj 特别敬佩 Meror 创始人的一点:进入一个已经投入了大量聪明团队和巨额资本的领域,需要面对极大的心理压力。Triplebyte 融资约五千万美元,其主要竞对 Hired 融资超过一亿美元,招聘市场公司总计获得了数亿美元投资,但作为一个品类整体表现不佳。即使你手握"LLM 改变了一切"的论点,两年前这个 pitch 也远不如今天有说服力。创始人必须愿意推开大批冷嘲热讽和亏损累累的投资人。
Gary 指出这与 Instacart 的故事完全一致:WebVan 是一具"腐朽的创业尸体"挂在门上,多数人看到它会说"我不想靠近那个"。但与此同时,iPhone 和安卓手机已经无处不在,移动市场(Mobile Marketplace)首次成为可能——这便是 Instacart 诞生的条件。用创新迷宫(Idea Maze)的比喻来说,AI 让所有墙壁都移位了,唯一找到出路的方式就是亲自走进迷宫。
专注市场中的细分环节
即使不构建完整市场,专注市场的某个细分环节也能成为绝佳想法。Apriora 是 YC 合伙人 Nico 在 2024 年冬季投资的公司,其核心前提是构建 AI 智能体来运行技术面试筛选。工程师团队在招聘中花费大量时间做初筛,通过率极低,工程师又讨厌做这件事。Apriora 的产品已被大公司采用并快速增长。
更重要的是,Apriora 展示了 AI 如何扩展市场:过去的筛选产品只能做简单评估——把完全不懂编程的人筛掉。而 LLM 赋能的 Apriora 能做更精细的分级筛选,让公司愿意把高级工程师也纳入筛查范围,这大大拓展了可用市场。
超个性化学习:教育科技的圣杯
Harj 提到,教育领域的超个性化(Hyperpersonalization)是教育科技(Edtech)长期以来的圣杯。每个学生的学习旅程都是独特的,但传统教育无法做到因材施教。互联网虽然让知识获取变得更容易,但真正的个性化学习或"口袋里的私人导师"直到现在才首次成为可能。
YC 已在资助相关团队,例如 Nico 投资的 Revision Dojo——帮助学生进行考试备考,是闪卡(Flashcard)的升级版:不是枯燥地机械翻阅内容,而是真正为学生量身定制的学习体验,拥有大量日活用户(DAU)和重度用户。
Jared 介绍了 Adexia,该公司为教师提供批改作业的 AI 智能体。研究表明,教师离职的最大原因就是厌恶批改作业——就像工程师厌恶做招聘筛选一样。Adexia 让这个痛苦环节得到极大缓解。不过目前主要是私立学校在使用这类工具,公立学校因政策限制更难采用,而这恰恰是最需要它们的群体。
消费级 AI 的商业模式变革
Gary 提出了一个关键问题:更好的产品是否自动意味着更多分发(Distribution),尤其对消费级市场而言?
Harj 分析了教育科技的付费困境:面向年幼用户的产品需要让家长付费,但家长不愿为一个孩子不投入的自学课程付太多钱。然而,如果你的应用从"完成率低的自学课程"升级为"媲美最佳人类数学导师"的体验,家长就会愿意支付高得多的费用。这实际上改变了商业模式——你不需要百万家长,十万家长每月支付可观费用就能支撑一个规模远超以往的业务。
Gary 指出,这与企业市场的逻辑一致:当企业不再把你当作 SaaS 软件,而是把你当作替代客户支持团队或分析团队的方案时,预算就会大幅增加。同样的逻辑也适用于消费市场。
关于护城河(Moat),Gary 强调品牌(Brand)、切换成本(Switching Cost)和生态整合(Integration)才是持久收入流的来源,仅仅"加入 AI"远远不够。Sam Altman 也多次谈到这一点。
Google 与 OpenAI:平台中立性的困境
讨论转向了科技巨头的竞争格局。OpenAI 刚刚聘请了 Instacart 的 CEO 担任应用层负责人,这表明他们正在加码应用层。Gary 提出了一个深刻观点:我们正需要平台中立性(Platform Neutrality)。回顾历史,网络中立性(Net Neutrality)确保了互联网的自由市场;Windows 被要求让用户选择浏览器和搜索引擎——正是这些干预让 Google 得以在 Internet Explorer 时代崛起。如今,为什么手机上的语音助手不能让用户自由选择?用户不应被迫使用 Google Assistant 或 Siri。
Siri 仍然非常笨拙,这恰恰说明大型科技平台仍在压制 AI 实验室的能力释放。
Google 的内部困境与创新者窘境
嘉宾们观察到 Gemini Pro 模型在某些任务上与 o3 不相上下甚至更优,但其消费者使用量仅为 ChatGPT 的极小比例。Google 内部存在 Gemini 和 Vertex.ai Gemini 两个不同产品,分别来自 DeepMind 和 GCP 两个不同组织——这是典型的"发布组织架构而非产品"(Ship the Org)的问题。VP 层让两个团队相互竞争,而非由 CEO 做出明确决策。
更深层的是 Google 拥有 TPU——正如《权力的游戏》中丹妮莉丝·坦格利安(Daenerys Targaryen)拥有龙一样,TPU 就是 Google 的龙。这让 Google 有能力将智能成本大幅降低,并实现成本效益极高的大上下文窗口——其他实验室尚未推出同等规模上下文窗口,主要原因正是成本。
然而 Google 面临经典的创新者窘境(Innovator's Dilemma):如果把 google.com 替换为 Gemini Pro,它可能瞬间成为全球第一聊天机器人服务,但这将放弃 80% 的营收。需要一位强有力的创始人 CEO 才能做出这种决策——正如扎克伯格将公司更名为 Meta 那样。
Meta AI 的尴尬整合
Meta AI 被硬塞进 WhatsApp 和 Facebook 等应用中,但体验糟糕。嘉宾们分享了一个典型场景:在蓝色应用(facebook.com)中问 Meta AI"我下周去巴塞罗那,那里有哪些朋友?",得到的回答却是"抱歉,作为 AI,我没有访问权限"——这完全违背了用户对整合社交数据的期待。Gary 形容这像"Facebook 的人直接站在你的聊天里",需要更多设计品味(Design Taste)。
Pete Koomen 的系统提示词洞察
YC 合伙人 Pete Koomen 撰写了一篇深度文章,分析了 Gemini 与 Gmail 的整合为何做错了。核心观点是:当前系统将系统提示词(System Prompt)置于用户之上,用户无法修改 AI 的语气和行为。例如,当 Pete 请 AI 代写一封病假邮件时,输出过于正式,因为用户根本无法调整语气。Pete 认为,真正赋能用户意味着允许用户修改系统提示词——这甚至暗示了 AI 优先的氛围编程博客平台(AI-first Vibe Coding Blog Platform)的创业机会。
全栈创业公司的复兴
2010 年代曾涌现一批全栈创业公司(Full Stack Startups),灵感来自 Balaji Srinivasan 的博客文章——"软件吞噬世界"意味着软件不仅要进入现实世界,还要拥有和运营整个价值链。Triplebyte 本质上是全栈招聘机构,Atrium 是全栈律师事务所。然而这类公司普遍忽视了毛利率(Gross Margin)的重要性:Triplebyte 虽然达到了 2000-2400 万美元年化收入(ARR),但与顶尖软件公司相比并不亮眼,且越来越难扩展,因为需要雇佣越来越多的人。
Zenefits 是另一个例子:过度依赖招聘更多销售和客户成功人员,而非构建能创造毛利率的软件。Parker Conrad 从中吸取教训,在 Rippling 中强制工程师做客户支持,以确保他们构建的软件不需要太多人工支持。
Harj 提出了一个牛市论点:现在正是重新构建全栈公司的时候——Triplebyte 2.0 不再需要庞大的运营团队和低毛利率,因为 AI 智能体可以完成所有工作。全栈公司首次可以在底层看起来像软件公司。Justin Khan 的 Atrium 失败于 AI 不够好的时代,但如今 Legora(YC 投资的增长最快的公司之一)正在为律师构建 AI 工具,最终其智能体将完成所有法律工作,成为全球最大的律师事务所。
ML 基础设施公司的漫长等待与爆发
Jared 回忆 2020 年回到 YC 时,团队对 ML 运维(MLOps)公司毫无兴趣。2019 年的数据显示,申请构建 ML 工具的公司甚至多于使用这些工具的公司——因为 ML 本身还不够好用,没有真正的客户。方向性完全正确,只是时机不对。
Replicate 是 Winter 20 批次的公司,疫情期间业务惨淡到团队停工数月。他们默默构建了两年,直到图像扩散模型(Image Diffusion Model)问世后一夜爆发。Ollama 的故事类似:疫情时代开始做开源模型部署工具,长期默默无闻,直到 LLaMA 发布后,成为开发者本地运行开源模型的最简方式,需求瞬间爆发。
Deepgram 更是典型案例:两位弦论物理学博士因对深度学习的数学美感产生兴趣而创业,从 2016 年开始做语音转文字(Speech-to-Text),产品长期表现平平、无人关注。但创始人们坚持不懈,当语音智能体(Voice Agent)爆发后,几乎所有语音智能体都需要语音转文字和文字转语音功能,Deepgram 成了底层基础设施,近两年迅猛增长。
元观点:创业方法论的时代更迭
Gary 分享了一个在大学巡讲中获得的洞察:前 AI 时代有一条已成信条的创业建议——"先卖再造"(Sell Before You Build)、精益创业(Lean Startup)、快速试错(Fail Fast)。这在 20 年的创意被反复淘洗后确实合理。然而在 AI 新时代,这套方法论已经过时。正确的心智模型更接近 Harj 所说的:使用有趣的技术、追随自身好奇心、探索可能性。正如 Paul Graham 所言,如果你站在未来前沿、探索最新技术,就很可能自然地撞上一个好创意。而今天的独特之处在于:运用正确的提示词和数据集,加上一点独创性、正确的评估和一点品味,就能获得令人惊叹的输出。
这仍然是一个秘密——看看那些数百家独角兽公司,增长稳健、现金充裕,但内部真正进行 AI 变革的少之又少。甚至 OpenAI 的首席研究官 Bob McGrew 也感到震惊:他原以为 o1、o3 的发布会引发"智能便宜到不值钱"的狂潮,但现实是大多数公司仍在按部就班执行一年前的季度路线图。
节目的核心结论:此刻是创业的最好时机。太多想法在一年前还不可能实现,而找到它们的最佳方式就是追随自己的好奇心、持续构建。