现在可以用 AI 构建的创业想法

cover

摘要

本期 Y Combinator 的 Light Cone 节目由多位合伙人共同讨论：在 AI（尤其是大语言模型）能力突飞猛进的当下，哪些曾经不可行或效果不佳的创业想法现在终于迎来了窗口期。Harj 以自身经营招聘创业公司 Triplebyte 的经历为例，说明过去需要数年积累标注数据才能做好的工程师评估，如今借助 LLM 第一天就能实现——这正是 Meror 等新锐招聘公司迅速崛起的原因。Gary 则聚焦教育领域，指出超个性化学习（Hyperpersonalization）这一教育科技的圣杯终于可及，Revision Dojo 和 Speak 等公司已展现出强劲的用户增长。讨论进一步延伸至：三方/四方市场如何因 AI 压缩为两方市场、消费级 AI 产品的商业模式变革（从"卖软件"转向"替代真人服务"的定价逻辑）、护城河（Moat）的真正来源、Google 与 OpenAI 之间的平台竞争与平台中立性问题、全栈创业公司（Full Stack Startups）为何在上一轮失败而如今有机会复兴，以及 Replicate、Ollama、Deepgram 等基础设施公司如何在漫长低谷后迎来爆发。节目最后提出一个元观点：前 AI 时代"先卖再造、精益创业"的经典教条已过时，当今最有效的创业路径是追随自身好奇心、站在技术前沿，用正确的提示词、数据集和评估方法即可创造出令人惊叹的产品。

正文

基础设施仍待建设

节目开场，嘉宾们便达成共识：围绕 AI 部署和智能体（Agent）使用的工具链与基础设施仍有大量空白。如果你身处未来前沿、持续探索最新技术，就很可能"撞上"一个绝佳的创业想法——只需运用恰当的提示词（Prompt）、数据集、一点独创性、正确的评估（Eval）和一点品味，就能获得如同魔法般的输出。Gemini 2.5 Pro 带来了百万令牌上下文窗口（Million Token Context Window），这类新能力正在催生大量此前不可能实现的创业构想。

招聘市场的重构

Harj 回顾了自己经营 Triplebyte 近五年的经验。2015 年前后，招聘创业公司曾是一个热门赛道，核心思路是将市场模型（Marketplace Model）应用于招聘——特别是工程师招聘。Triplebyte 的 thesis 是：不开放任何人进入市场，而是构建一个精选市场（Curated Marketplace），通过技术面试评估工程师并提供丰富数据。然而这一切在 LLM 时代之前完全依赖人工：他们花了数年自建软件、进行数千场技术面试来挤压每一个数据点，最终才积累了足够的标注数据集（Label Dataset）来运行机器学习模型。更复杂的是，Triplebyte 本质上是一个三方市场（Three-sided Marketplace）：公司需要招人、工程师需要工作、还需要签约面试官来面试工程师——三方的协调成本极高。

而如今，AI 代码生成模型（AI Codegen Model）可以胜任代码评估，像 Meror 这样的公司在第一天就能用 LLM 完成评估环节，省去了构建标注数据集的数年时间。更重要的是，LLM 让从工程师扩展到分析师等其他知识工作者变得轻而易举——过去每拓展一个领域都要重建标注数据集，如今只需换一个 prompt。

Gary 提出了一个有力的思维框架：去审视世界上所有的市场，问一句"LLM 会如何改变这个市场？"例如，多邻国（Duolingo）这样的两方市场可能正面临压力，因为用户也许会直接用 AI 来练习外语对话。

创始人的心理挑战与 Instacart 式机遇

Harj 特别敬佩 Meror 创始人的一点：进入一个已经投入了大量聪明团队和巨额资本的领域，需要面对极大的心理压力。Triplebyte 融资约五千万美元，其主要竞对 Hired 融资超过一亿美元，招聘市场公司总计获得了数亿美元投资，但作为一个品类整体表现不佳。即使你手握"LLM 改变了一切"的论点，两年前这个 pitch 也远不如今天有说服力。创始人必须愿意推开大批冷嘲热讽和亏损累累的投资人。

Gary 指出这与 Instacart 的故事完全一致：WebVan 是一具"腐朽的创业尸体"挂在门上，多数人看到它会说"我不想靠近那个"。但与此同时，iPhone 和安卓手机已经无处不在，移动市场（Mobile Marketplace）首次成为可能——这便是 Instacart 诞生的条件。用创新迷宫（Idea Maze）的比喻来说，AI 让所有墙壁都移位了，唯一找到出路的方式就是亲自走进迷宫。

专注市场中的细分环节

即使不构建完整市场，专注市场的某个细分环节也能成为绝佳想法。Apriora 是 YC 合伙人 Nico 在 2024 年冬季投资的公司，其核心前提是构建 AI 智能体来运行技术面试筛选。工程师团队在招聘中花费大量时间做初筛，通过率极低，工程师又讨厌做这件事。Apriora 的产品已被大公司采用并快速增长。

更重要的是，Apriora 展示了 AI 如何扩展市场：过去的筛选产品只能做简单评估——把完全不懂编程的人筛掉。而 LLM 赋能的 Apriora 能做更精细的分级筛选，让公司愿意把高级工程师也纳入筛查范围，这大大拓展了可用市场。

超个性化学习：教育科技的圣杯

Harj 提到，教育领域的超个性化（Hyperpersonalization）是教育科技（Edtech）长期以来的圣杯。每个学生的学习旅程都是独特的，但传统教育无法做到因材施教。互联网虽然让知识获取变得更容易，但真正的个性化学习或"口袋里的私人导师"直到现在才首次成为可能。

YC 已在资助相关团队，例如 Nico 投资的 Revision Dojo——帮助学生进行考试备考，是闪卡（Flashcard）的升级版：不是枯燥地机械翻阅内容，而是真正为学生量身定制的学习体验，拥有大量日活用户（DAU）和重度用户。

Jared 介绍了 Adexia，该公司为教师提供批改作业的 AI 智能体。研究表明，教师离职的最大原因就是厌恶批改作业——就像工程师厌恶做招聘筛选一样。Adexia 让这个痛苦环节得到极大缓解。不过目前主要是私立学校在使用这类工具，公立学校因政策限制更难采用，而这恰恰是最需要它们的群体。

消费级 AI 的商业模式变革

Gary 提出了一个关键问题：更好的产品是否自动意味着更多分发（Distribution），尤其对消费级市场而言？

Harj 分析了教育科技的付费困境：面向年幼用户的产品需要让家长付费，但家长不愿为一个孩子不投入的自学课程付太多钱。然而，如果你的应用从"完成率低的自学课程"升级为"媲美最佳人类数学导师"的体验，家长就会愿意支付高得多的费用。这实际上改变了商业模式——你不需要百万家长，十万家长每月支付可观费用就能支撑一个规模远超以往的业务。

Gary 指出，这与企业市场的逻辑一致：当企业不再把你当作 SaaS 软件，而是把你当作替代客户支持团队或分析团队的方案时，预算就会大幅增加。同样的逻辑也适用于消费市场。

关于护城河（Moat），Gary 强调品牌（Brand）、切换成本（Switching Cost）和生态整合（Integration）才是持久收入流的来源，仅仅"加入 AI"远远不够。Sam Altman 也多次谈到这一点。

Google 与 OpenAI：平台中立性的困境

讨论转向了科技巨头的竞争格局。OpenAI 刚刚聘请了 Instacart 的 CEO 担任应用层负责人，这表明他们正在加码应用层。Gary 提出了一个深刻观点：我们正需要平台中立性（Platform Neutrality）。回顾历史，网络中立性（Net Neutrality）确保了互联网的自由市场；Windows 被要求让用户选择浏览器和搜索引擎——正是这些干预让 Google 得以在 Internet Explorer 时代崛起。如今，为什么手机上的语音助手不能让用户自由选择？用户不应被迫使用 Google Assistant 或 Siri。

Siri 仍然非常笨拙，这恰恰说明大型科技平台仍在压制 AI 实验室的能力释放。

Google 的内部困境与创新者窘境

嘉宾们观察到 Gemini Pro 模型在某些任务上与 o3 不相上下甚至更优，但其消费者使用量仅为 ChatGPT 的极小比例。Google 内部存在 Gemini 和 Vertex.ai Gemini 两个不同产品，分别来自 DeepMind 和 GCP 两个不同组织——这是典型的"发布组织架构而非产品"（Ship the Org）的问题。VP 层让两个团队相互竞争，而非由 CEO 做出明确决策。

更深层的是 Google 拥有 TPU——正如《权力的游戏》中丹妮莉丝·坦格利安（Daenerys Targaryen）拥有龙一样，TPU 就是 Google 的龙。这让 Google 有能力将智能成本大幅降低，并实现成本效益极高的大上下文窗口——其他实验室尚未推出同等规模上下文窗口，主要原因正是成本。

然而 Google 面临经典的创新者窘境（Innovator's Dilemma）：如果把 google.com 替换为 Gemini Pro，它可能瞬间成为全球第一聊天机器人服务，但这将放弃 80% 的营收。需要一位强有力的创始人 CEO 才能做出这种决策——正如扎克伯格将公司更名为 Meta 那样。

Meta AI 的尴尬整合

Meta AI 被硬塞进 WhatsApp 和 Facebook 等应用中，但体验糟糕。嘉宾们分享了一个典型场景：在蓝色应用（facebook.com）中问 Meta AI"我下周去巴塞罗那，那里有哪些朋友？"，得到的回答却是"抱歉，作为 AI，我没有访问权限"——这完全违背了用户对整合社交数据的期待。Gary 形容这像"Facebook 的人直接站在你的聊天里"，需要更多设计品味（Design Taste）。

Pete Koomen 的系统提示词洞察

YC 合伙人 Pete Koomen 撰写了一篇深度文章，分析了 Gemini 与 Gmail 的整合为何做错了。核心观点是：当前系统将系统提示词（System Prompt）置于用户之上，用户无法修改 AI 的语气和行为。例如，当 Pete 请 AI 代写一封病假邮件时，输出过于正式，因为用户根本无法调整语气。Pete 认为，真正赋能用户意味着允许用户修改系统提示词——这甚至暗示了 AI 优先的氛围编程博客平台（AI-first Vibe Coding Blog Platform）的创业机会。

全栈创业公司的复兴

2010 年代曾涌现一批全栈创业公司（Full Stack Startups），灵感来自 Balaji Srinivasan 的博客文章——"软件吞噬世界"意味着软件不仅要进入现实世界，还要拥有和运营整个价值链。Triplebyte 本质上是全栈招聘机构，Atrium 是全栈律师事务所。然而这类公司普遍忽视了毛利率（Gross Margin）的重要性：Triplebyte 虽然达到了 2000-2400 万美元年化收入（ARR），但与顶尖软件公司相比并不亮眼，且越来越难扩展，因为需要雇佣越来越多的人。

Zenefits 是另一个例子：过度依赖招聘更多销售和客户成功人员，而非构建能创造毛利率的软件。Parker Conrad 从中吸取教训，在 Rippling 中强制工程师做客户支持，以确保他们构建的软件不需要太多人工支持。

Harj 提出了一个牛市论点：现在正是重新构建全栈公司的时候——Triplebyte 2.0 不再需要庞大的运营团队和低毛利率，因为 AI 智能体可以完成所有工作。全栈公司首次可以在底层看起来像软件公司。Justin Khan 的 Atrium 失败于 AI 不够好的时代，但如今 Legora（YC 投资的增长最快的公司之一）正在为律师构建 AI 工具，最终其智能体将完成所有法律工作，成为全球最大的律师事务所。

ML 基础设施公司的漫长等待与爆发

Jared 回忆 2020 年回到 YC 时，团队对 ML 运维（MLOps）公司毫无兴趣。2019 年的数据显示，申请构建 ML 工具的公司甚至多于使用这些工具的公司——因为 ML 本身还不够好用，没有真正的客户。方向性完全正确，只是时机不对。

Replicate 是 Winter 20 批次的公司，疫情期间业务惨淡到团队停工数月。他们默默构建了两年，直到图像扩散模型（Image Diffusion Model）问世后一夜爆发。Ollama 的故事类似：疫情时代开始做开源模型部署工具，长期默默无闻，直到 LLaMA 发布后，成为开发者本地运行开源模型的最简方式，需求瞬间爆发。

Deepgram 更是典型案例：两位弦论物理学博士因对深度学习的数学美感产生兴趣而创业，从 2016 年开始做语音转文字（Speech-to-Text），产品长期表现平平、无人关注。但创始人们坚持不懈，当语音智能体（Voice Agent）爆发后，几乎所有语音智能体都需要语音转文字和文字转语音功能，Deepgram 成了底层基础设施，近两年迅猛增长。

元观点：创业方法论的时代更迭

Gary 分享了一个在大学巡讲中获得的洞察：前 AI 时代有一条已成信条的创业建议——"先卖再造"（Sell Before You Build）、精益创业（Lean Startup）、快速试错（Fail Fast）。这在 20 年的创意被反复淘洗后确实合理。然而在 AI 新时代，这套方法论已经过时。正确的心智模型更接近 Harj 所说的：使用有趣的技术、追随自身好奇心、探索可能性。正如 Paul Graham 所言，如果你站在未来前沿、探索最新技术，就很可能自然地撞上一个好创意。而今天的独特之处在于：运用正确的提示词和数据集，加上一点独创性、正确的评估和一点品味，就能获得令人惊叹的输出。

这仍然是一个秘密——看看那些数百家独角兽公司，增长稳健、现金充裕，但内部真正进行 AI 变革的少之又少。甚至 OpenAI 的首席研究官 Bob McGrew 也感到震惊：他原以为 o1、o3 的发布会引发"智能便宜到不值钱"的狂潮，但现实是大多数公司仍在按部就班执行一年前的季度路线图。

节目的核心结论：此刻是创业的最好时机。太多想法在一年前还不可能实现，而找到它们的最佳方式就是追随自己的好奇心、持续构建。