AI 创业方法论（AI Startup Playbook）

使用场景

正在 AI 领域寻找创业方向的潜在创始人（技术背景 or 行业背景）
已有技术方向，需要系统理解 AI 创业全流程的早期团队
希望理解 AI 时代护城河逻辑、制定差异化策略的创始人
在传统行业中看到 AI 替代机会、想做「全栈 AI 竞争者」的领域专家
希望通过 AI 工具将小团队杠杆最大化的初创公司
希望将组织转型为 AI 原生运营模式的创始人/管理者
需要理解 AI 创业方法论与经典创业方法论差异的投资人和顾问

不适用或需要谨慎：
- 纯技术研究型 AI 公司（聚焦技术突破本身，非创业方法论）
- 已规模化的大公司（全量转型成本极高，非从零构建）
- 追随热门 AI 赛道但缺乏独特洞察的创始人（YC 反复警告「焦油坑陷阱」）
- 只是想「做个 ChatGPT 套壳」快速赚快钱（壁垒极低，不在本文讨论范围）

YC 核心原则：AI 改变了什么、没改变什么

AI 改变了什么

创业方法论本身发生范式转移：前 AI 时代「先卖后建、精益创业、快速 MVP 验证」的经典教条已过时。当全新技术范式出现时，创意空间被大幅拓展——大量以前不可能的想法现在变得可行。正确的思维模型不是「验证已知痛点」，而是追随好奇心、站在技术前沿探索可能性。Paul Graham 的「生活在未来的前沿」——如果你身处技术最前沿，好的创业创意不会稀缺，你会自然「撞上」它们。（来源：20250528-In-the-AI-era-the-playbook-is-changing）
竞争的计量单位变了：从「团队规模」转向「人均 AI 杠杆」。AI 工具打破了协调成本的制约——大型组织中跨人员沟通协作成本巨大，而 AI 赋能的个体产生阶跃式变化。10 人千亿公司成为可想象的目标。（来源：20250801-The-First-10-person-100B-Company）
市场天花板变了：垂直 AI 代理是「软件 + 人力」一体化产品——不仅替代传统 SaaS 软件，还通过自动化取代操作软件的人力团队，同时吃掉软件预算和人力薪酬预算。市场天花板可比传统 SaaS 大 10 倍。（来源：20241122-Vertical-AI-Agents-Could-Be-10X-Bigger-Than-SaaS）
护城河形态变了：传统七种力量依然适用但形态重塑——速度成为 AI 创业早期唯一真正的护城河。「反向定位」因 AI 公司的按结果定价 vs SaaS 的按席位定价而威力大增。（来源：20251003-The-7-Most-Powerful-Moats-For-AI-Startups）
公司运营模式变了：从「以人为中心的开环系统」转变为「以 AI 为操作系统的智能闭环组织」——不是效率增量，而是全新能力。（来源：20260424-How-To-Build-A-Company-With-AI-From-The-Ground-Up）
商业模式变了：从按席位（Per-seat）定价转向按消费量（Consumption-based）+ 订阅的组合——AI 智能体让你可以在软件中包含该岗位的劳动量，突破按席位的人口天花板。（来源：20250916-Aaron-Levie-Why-Startups-Win-In-The-AI-Era）

AI 没有改变什么

创业本质上仍然很难：AI 让构建更容易，但创业不会因此更容易。必须找到愿意用十年人生去解决的问题，不能因为 AI 让你能快速完成项目就附着于不真正关心的问题。（来源：20260506-Harshil-Mathur-AI-Is-Compressing-Every-Moat）
创始人-市场契合（Founder-Market Fit）仍是核心判据：最优秀的创始人既是卓越的工程师和技术专家，同时又对世界的某个角落拥有极少数人才理解的洞见——这两者的交集才是十亿美元级创业公司的诞生之地。（来源：20250706-The-Real-Moat）
「无聊的工作流自动化」仍然是真正的金矿：2023 年 YC 夏季批次约 50% 公司涉及大语言模型——但真正起飞的不是炫酷的 AI 生成视频或 AGI 研究，而是工作流自动化。世界上有大量隐藏在后方的办公室岗位——人们的工作是阅读、摘要、将数据从一个系统重新录入另一个系统。「有污泥的地方就有金子」（Where there's muck, there's brass）。（来源：20240208-The-Truth-About-Building-AI-Startups-Today）
大企业仍然做不好软件：「95% AI 项目失败」是严重误读——失败源于大企业内部软件能力缺陷，而非 AI 技术问题。大企业受困于内部 IT 系统落后、咨询公司缺乏技术深度、工程团队中许多人本身不相信 AI、组织政治内耗严重。在每一个应该存在却不存在的系统中，都有一个「初创公司形状的空洞」。（来源：20251030-Good-News-For-Startups-Enterprise-Is-Bad-At-AI）
窗口期真实且有限：Aaron Levie 预判，这个创业黄金窗口只有两到三年，约 2024 到 2027 年左右——下一批数百家伟大公司将诞生，而这样的窗口每十到二十年才出现一次。（来源：20250916-Aaron-Levie-Why-Startups-Win-In-The-AI-Era）

分步骤做法

Step 1：选择 AI 创业方向

选方向的正确思维不是「做什么 AI 产品」，而是「AI 让我能第一次做什么以前不可能的事」。Aaron Levie 的「名词与动词」框架：AI 创造了全新的「名词与动词」——那些以前只能由人完成的专业服务，现在首次可以通过软件交付。关键不是做「带 AI 的 CRM」（在位者会做），而是找「以前只能由人完成、历史上首次可通过软件交付」的领域。（来源：20250916）

1.1 四大创业路径

路径	定义	适合谁	典型例子
垂直 AI 代理	用 AI 替代特定垂直领域的整个工作流程和人岗	有行业 deep domain knowledge 的创始人	CaseText（法律 AI）、MCH（QA 代理）、Salient（债务催收）
全栈 AI 公司	用 AI 直接成为行业竞争者，而非卖工具给在位者	有足够野心、行业在位者行动迟缓	Legora（AI 律所直接竞争传统律所）
AI-Native 企业服务	从零构建 AI 嵌入核心工作流的系统，不只是「贴一层 AI」	曾在 SaaS 或企业软件行业有经验的创始人	Castle AI（AI 原生的抵押贷款承销 vs 老供应商的「贴皮 AI」）
AI 基础设施/工具	为 AI 生态提供模型部署、数据管线、评估等工具	有深厚 ML/Infra 背景的创始人	Replicate、Ollama、Deepgram、Exa

核心建议： 如果你有行业 deep domain knowledge，优先选择垂直 AI 代理或全栈 AI 公司。基础设施需要漫长等待期（Replicate、Ollama 等公司的经历表明这个路径需要极高的耐心和资本）。如果缺乏特定行业深度，优先考虑通过实习或深入一线体验来获取（参见「向内深挖 + 走出家门」方法）。

1.2 发现 AI 创业方向的核心方法

向内深挖：利用自身独特的专业经验。Salient 创始人曾在 Tesla 金融运营团队工作，发现汽车贷款催收全依赖手动外包；Data Curve 创始人从 Cohere 实习经验 pivot 到 LLM 数据工具，年收入中高七位数。YC 大量十亿美元公司可直接追溯到创始人的实习经历（「实习生效应」）。（来源：20250207-How-To-Get-AI-Startup-Ideas）

走出家门：深入行业一线，从第一性原理理解真实痛点。ESS Health 创始人去母亲牙科诊所工作一天发现大量可被 LLM 自动化的行政工作；Sweet Spot 创业想法来自看到朋友手动刷新政府采购网站找投标机会。（来源：20250207）

寻找「Boring Repetitive Admin Work」：在 Indeed 搜索「远程文员」，寻找可被 AI 自动化的工作类别——任何被外包到低工资国家的重复性信息处理任务，都是 AI 替代的强信号。（来源：20240208；20241122）

自问「买方的 AI 能力」：如果目标客户两年后能用 Claude Code 自己搭建你的产品，你的价值在哪里？围绕这个威胁提前规划战略。（来源：20251007-Ask-These-Questions-Before-Starting-An-AI-Startup）

1.3 方向选择的红绿灯

✅ 绿灯信号：
- 目标行业行动迟缓、在位者技术保守
- 存在大量「Boring Repetitive Admin Work」
- 市场看似拥挤但实际只有 3-4 家认真做（「虚假拥挤」赛道）
- 你具有该领域极少数人才拥有的独特洞见
- 按结果定价可以比按席位定价创造 10 倍收入

🟡 黄灯信号：
- 纯消费品类 AI 通用助手（科技巨头在争抢入口）
- 不需要任何行业专长的通用 AI 功能
- 还没有亲自深入行业验证就选定的方向

🔴 红灯信号：
- 简单的 ChatGPT 套壳、无差异化壁垒
- 试图构建「大而全」的 AI 平台而非窄楔形产品
- 追随热门 AI 赛道但无法在 90 秒内说清为什么你而非他人
- 只做「卖铲子」但在位者也在武装自己（如 Anthropic 对齐负责人警告：买方也在被 AI 武装）

Step 2：验证 AI 产品的特殊性

AI 产品验证与传统 SaaS 产品验证有本质不同——因为用户对 AI 的期望值已被 ChatGPT 等产品拉高，而 AI 系统的核心挑战（推理成本、幻觉、长尾可靠性）与传统软件完全不同。

2.1 AI 产品的三大特殊挑战

挑战一：从「70% 可用」到「100% 生产可靠」是真正的壁垒

CaseText 创始人 Jake Heller 的核心洞察：批评者会说「这只是 GPT 套壳」，但从 70% 情况可用的 Demo 到 100% 生产可靠的差距，恰恰是垂直 AI 代理真正的价值和壁垒。在法律等关键任务领域，一次错误引用或关键事实遗漏可能导致灾难性后果——「必须让用户在第一次接触和第一周内获得完美体验」。（来源：20241004-Why-Vertical-LLM-Agents-Are-The-New-1-Billion-SaaS-Opportunities）

挑战二：幻觉不是 bug，是必须被系统性治理的系统特性

GPT-3 和 3.5 虽然能生成像律师口吻的文本，但幻觉严重。GPT-4 的问世是量子级的跃迁——在禁用训练集的律师资格考试中从只超过 10% 考生一跃击败 90% 应试者。靠底层模型进步直接提升产品可靠性是 B2B AI 公司的核心增长引擎——每一次模型迭代都可以直接打包为溢价功能收取更高费用。YC 数据实证：有公司在批次开始时年收入 600 万美元，三四个月后飙升至超过 3000 万美元。（来源：20240626-Better-models-better-startups；20241004）

挑战三：用户期望被 ChatGPT 拉高——你的产品必须比「通用 AI+手动操作」好 10 倍

AI 产品不再只需比传统软件好，还需要比「用户用 ChatGPT + 手动操作」好很多——因为这是用户已经可以免费使用的替代方案。如果你的产品只是稍好一点，用户没动机切换。

2.2 如何验证 AI 产品：测试驱动提示工程（Jake Heller 方法论）

CaseText 方法论（已被 YC 推荐为垂直 AI 代理的黄金标准）：

将复杂任务拆解为子步骤：如「法律研究并撰写备忘录」拆解为十多个子步骤——如何将自然语言查询转化为布尔搜索语句、如何对上百个结果逐一阅读摘要提炼、如何整合成带引用的备忘录。
为每个子步骤编写测试用例：针对每个子步骤，编写数百到数千条测试用例，预先定义「黄金标准」答案。
不断迭代提示直到通过测试：提示工程师不断撰写完善英文指令，直到模型在测试集上达到近乎完美的通过率。一旦某个指令修正解决了一个问题却破坏了其他测试，必须重新调整。
不要低估「脏活」的量：在提示工程之前还有大量系统整合工作（DMS 连接、OCR 微调、专有数据标注等），这些构成了比提示策略本身更难复制的护城河。

（来源：20241004）

2.3 验证清单

[ ] 你的产品在当前最强模型下，能否达到生产级可靠性（＞95% 准确率）？
[ ] 你是否为关键子步骤建立了测试集和评估体系（Evals）？
[ ] 用户用「ChatGPT + 手动操作」替代你的产品的成本是否高到不值得？
[ ] 底层模型迭代时，你的产品能否直接受益而非被碾压？（关键区分：包含大量具体业务逻辑 vs 纯 prompt wrapper）
[ ] 你是否在客户专有数据连接和系统集成上投入了足够精力（这些是「脏活护城河」）？
[ ] 你是否测试过模型在边缘案例（手写批注、歪斜扫描页、奇葩数据格式）上的表现？

Step 3：小团队构建——10 人千亿公司的可能性

3.1 核心信念

YC 的核心信念：借助新一代 AI 工具，小型高能动性团队乃至独立创始人，完全有可能以少至 50 万美元的 YC 资金打造百亿甚至千亿美元市值的公司。这是云计算消除物理服务器投入资本的历史重演——十五年前云计算降低了资本门槛，如今 AI 降低了人员规模门槛。（来源：20250801）

3.2 小团队的结构性优势

小团队在规模化后拥有相对于臃肿在位者的结构性优势：不会陷入内斗、冗长会议和注意力涣散等大公司通病。大公司往往需要经过产品经理→运营流程→PRD 文档→规格说明→开发→发布等层层流程；而小团队可以保持极快的冲刺速度。（来源：20250801；20251003）

3.3 核心指标：人均营收（Revenue per Employee）

未来最优秀的初创公司都将优化人均营收这一核心指标。当 AI 工具可以替代大量重复性劳动时，团队规模不再是实力的衡量标准，人均产出才是。以下几个数字供参考：

Posterous 三次构建成本演变（Garry Tan 亲身案例）：2008 年 400 万美元 / 6-7 人 / 1.5 年 → 第二次 10 万美元 / 2 人 / 3 个月 → 2026 年 200 美元 / 1 人 / 5 天。约 400 倍效率提升。（来源：20260508-Tokenmaxxing）
StrongDM 的 EI 团队：代码仓库中零手写代码——只有人类编写的规格和测试工具，AI 智能体生成所有实现代码。并且它确实有效。（来源：20260424-How-To-Build-A-Company-With-AI-From-The-Ground-Up）
Cursor 的每日冲刺周期：创始人 Michael Truell 在 2023-2024 年间产品开发冲刺周期只有一天——每天重新开始计时，每天都要发布新功能。这种速度是任何大公司都无法企及的。（来源：20251003）

3.4 如何用 10 人构建 AI 公司

人员配置原则：
- 每个团队成员必须有极高能动性（High Agency）——自己发现问题、自己解决
- 优先招聘能用 AI 工具自我杠杆的通才，而非只能做一件事的专才
- 创始团队亲自使用编程智能体（Claude Code / Cursor / Windsurf），发展自己的 AI 信念——不要将 AI 战略委托他人
- 警惕组织臃肿：每多一个人，协调成本指数级上升

工具栈原则：
- Token 预算不要吝啬——每年准备 10 万-100 万美元 Token 费用，这是对未来竞争力的「时间扭曲」投资（参见 Step 5）
- 不做「无马马车」——AI 原生软件应是代理包裹确定性工具，而非确定性软件包裹 AI
- 从 Day 1 建立智能闭环：AI 笔记记录所有会议、所有数据集中到可查询数据库

3.5 什么情况下不适合 10 人策略

需要大量人工接触点的 B2B 业务（如 Razorpay 在客户支持上刻意不用 AI——关键时刻的人类接触点不可替代）
强监管行业中需要大量合规人员的场景
已证明 PMF、需要快速规模化抢占市场的阶段（此时该招人还是要招）

Step 4：构建护城河——AI 时代的七种力量 + 速度

YC 四位合伙人（Jared、Diana、Gary、Harj）围绕 Hamilton Helmer《七种力量》框架，将其重新映射到 AI 创业语境，并补充了第八道护城河——速度。核心原则：先有东西可守，再谈护城河。护城河本质是防御性的——如果什么都没有，就别操心护城河，那就像田野里的一滩水洼。（来源：20251003）

4.1 速度（第八道护城河，早期最重要）

Windsurf 的 Varun：「在创业最早期，创业公司唯一的护城河就是速度。」Cursor 每天冲刺周期是教科书级案例。Gary Tan 总结：「如果有人因为看不到远期护城河而决定不做一个创业想法，那是很愚蠢的。先找到痛点、解决问题，护城河会在过程中自然浮现。」（来源：20251003）

你的速度审计：
- 产品迭代周期是多少天？Cursor 的标准是 1 天。
- 你的迭代速度与最大竞争对手相比快多少？
- 你是否能在用户的同一个痛点上比大公司快 10 倍迭代？

4.2 AI 时代的七种力量

护城河类型	AI 时代新形态	关键案例	如何构建
1. 流程力量	AI 代理复杂工作流中最后 10% 的「苦差事盲区」（Schlep Blindness）构成壁垒	CaseText、Greenlight（KYC）、Casa（贷款审批）	在真实世界条件下多年精细打磨复杂代理；黑客马拉松能做 90%，但最后 10% 让它在每天数万次请求中可靠运行才会建立壁垒
2. 垄断资源	前置部署工程师模式获取的私有数据和定制模型	Scale AI / Palantir 与 DoD 合作；Character AI 微调降低 10 倍成本	走出去与客户坐在一起，理解枯燥流程→转化为提示词和评估体系→转化为数据集微调自己的模型
3. 转换成本	深度定制的企业工作流一旦建立，大客户不会再做 Bake-off	Happy Robot × DHL 深度整合物流运营；Salient 金融 AI 语音代理	定制到客户核心运营工作流中去——AI 同时在降低传统数据迁移的转换成本，只有深度定制逻辑才构成真正的壁垒
4. 反向定位	按座位收费的 SaaS 被按结果收费的 AI 公司颠覆——越成功收入可能越低的阿喀琉斯之踵	Avoka（垂直 AI SaaS 比传统 SaaS 大 10 倍）；Legora vs Harvey 后发优势	采用按交付工作量和任务量的定价模式——让在位者的收入结构与新模式天然冲突
5. 品牌	ChatGPT 以品牌超越 Google Gemini	OpenAI vs Google	通过速度快速建立品牌心智——小团队可以比大公司早几个月发布
6. 网络经济	数据飞轮：更多使用→更好模型→更多使用	Cursor Tab 补全使用用户数据训练；Salient 客户员工使用产生的私有数据	建立评估体系（Evals）作为飞轮引擎——通过评估成功与否，将结果反馈并迭代改进
7. 规模经济	训练前沿 LLM 需大量资本；但 DeepSeek 削弱了此壁垒	Exa（为 AI 代理提供搜索 API 需大量固定资本但可复用）	创业公司在应用层比模型层更有优势——专注能累积数据/计算护城河的应用

4.3 护城河时机判断

阶段	护城河策略
0→1（探索 PMF）	只关注速度。不要纠结护城河问题——先找到痛点足够痛苦的人（「今年可能升不了职甚至被解雇，痛苦到不想上班」级别）
1→10（PMF 后规模化）	流程力量和转换成本开始形成——深度定制企业工作流；积累评估体系（Evals）建立数据飞轮
10→100（规模化防守）	反向定位和品牌开始发挥作用；垄断资源的积累（私有数据、定制模型）进入壁垒期

核心提醒： Razorpay 联合创始人 Harshil Mathur 警告——AI 正在压缩每一条护城河。技术作为壁垒的时代结束，唯一存续的竞争优势是决策速度和执行力。这意味着你必须持续奔跑——任何选择「等市场变化再应对」的公司已经死亡。（来源：20260506）

Step 5：构建 AI-Native 公司——闭环系统、Tokenmaxxing、技能文件

5.1 从「生产力思维」到「能力思维」

AI 带来的不是效率增量（30% 更快），而是全新的能力——拥有 AI 工具的合适人选现在可以构建过去需要整个团队甚至根本不可能完成的功能。这是范式转变，不是优化。（来源：20260424）

5.2 AI-Native 公司三大构建原则（YC Diana 方法论）

原则一：智能闭环（Intelligent Closed Loop）

每个重要流程被 AI 捕获——记录会议、最小化私信/邮件、在所有沟通渠道嵌入智能体、构建全公司自定义仪表板。「工程经理状态汇报那种极度信息有损的日子一去不复返了。」

原则二：可查询组织（Queryable Organization）

整个组织对 AI 可读——每个重要行动产出可供智能层学习的产物。核心实践：将所有业务数据集中到单一 PostgreSQL 数据库，给予代理完整只读访问——YC 内部经验表明这「释放了惊人威力」。

原则三：AI 软件工厂（AI Software Factory）

人类编写规格和测试，AI 智能体生成实现代码并迭代至通过测试。StrongDM 的 EI 团队已将代码仓库中完全没有手写代码的极致实践验证为可行。采用闭环实践的团队将工程 Sprint 时间缩短一半，在相同时间内完成接近 10 倍的工作量。

（来源：20260424）

5.3 Tokenmaxxing：最大化 Token 用量而非人数

核心概念：Garry Tan 提出 Tokenmaxxing——最大化 token 使用量来获取最佳输出。不要满足于一个来源，当可以获取 20 个来源时交叉引用，将所有上下文喂入核心提示词做出更好决策。如果有增量工作能让某个东西更完整，就应该 token max。（来源：20260508）

关键转变：从「写代码调用 LLM」到「写 Markdown 教 LLM 写代码」

过去：写 Python 调用 API
现在：写 Markdown 描述意图让 AI 生成代码
代码是脆弱的——不理解特殊情况、不知道你的意图。LLM 有潜在空间，知道你是谁、你的动机、能处理通用情况

Thin Harness, Fat Skills（薄线束，厚技能）架构哲学：

线束（Harness）：核心循环（接收输入→传 LLM→执行输出），应使用成熟工具（如 Claude Code）而非自建
技能（Skills）：用 Markdown 编写，把所有判断和上下文放在 LLM 擅长的领域，确定性操作留在代码中

Token 预算指南（Pete Koomen 方法论）：组织需要每年 10 万到 100 万美元 Token 费用实现 AI 原生运营。这是「时间扭曲」——今天花 10 万甚至 100 万做的事，两年后普及且成本低廉。就像 90 年代为员工购买昂贵计算机一样，这是对未来竞争力的投资。「花 10 万住在 2028 年」。（来源：20260527-Inside-YCs-AI-Playbook）

5.4 技能文件系统（Skill Files）：组织共享大脑

YC 内部实践——将最优秀员工的经验编码为可被 AI 代理调用的组织记忆：

格式：两句话描述
- 是什么（这个技能做什么）
- 何时使用（什么情况下调用这个技能）

实例： Pete Koomen 将创始人销售辅导经验写成技能文件后，任何人使用代理时都能自动调用其多年积累。新员工无需六个月入职培训，自动获得最佳实践者的隐性知识。（来源：20260527）

如何开始：
1. 创建第一个技能文件——将你最擅长的领域经验写成两句话
2. 让别人使用代理时测试该技能是否好用
3. 通过代理对话广播机制促进组织学习——所有代理对话默认对全员可见
4. 持续迭代：技能文件随着实践经验不断更新

5.5 行动清单

[ ] 将所有业务数据集中到单一 PostgreSQL 数据库（这是释放代理全部威力的前提）
[ ] 启动「默认公开」的代理对话广播——在小规模高信任团队中加速 AI 使用能力扩散
[ ] 创建首个技能文件——先记录一两个你最擅长的领域
[ ] 预算每年 10 万-100 万美元 Token 费用——视为对未来的「时间扭曲」投资，而非运营成本
[ ] 亲自使用编程智能体（Claude Code / Cursor / Windsurf），发展自己的 AI 信念——不要委托他人
[ ] 从「写代码调用 LLM」转向「写 Markdown 教 LLM 写代码」的架构范式
[ ] 建立 80-90% 测试覆盖率——氛围编码无测试的代码比手写代码差 10 倍
[ ] 不做「无马马车」——AI 原生软件应是代理包裹确定性工具，而非确定性软件包裹 AI

Step 6：AI 时代的销售与 GTM（Go-to-Market）

6.1 AI 销售的独特优势

销售对象从「被替代的人」转向「高层决策者」：

当你的 AI 代理可以完全替代一整个团队时，销售对话变成与 CEO/CFO 之间关于成本控制和组织精简的纯粹讨论——阻力大大减少。MCH 的 AI 质保测试代理销售话术干脆利落：「你根本不需要一个 QA 团队。」（来源：20241122）

「烘焙对决」策略： Castle AI 在与银行现有供应商的对比测试中直接胜出——因为老供应商的产品只是「贴了一层 AI」，而 Castle AI 是 AI 原生。如果你的产品是真正的 AI 原生（而非贴皮），直接要求与在位者做 bake-off。（来源：20251030）

6.2 定价模式：避开 SaaS 的阿喀琉斯之踵

传统 SaaS 按席位定价的陷阱：如果 AI 代理越做越好、客户需要的员工越少，在按席位收费模式下越成功收入越低——这是战略阿喀琉斯之踵。

正确的定价策略：
- 按结果/任务量定价：围绕「交付的工作量」或「完成的任务量」。Gary 举 Avoka 案例——ServiceTitan 只占 HVAC 公司总支出 1%，但 AI 客户支持支出占 4-10%。这意味着垂直 AI SaaS 代理可以比传统 SaaS 大至少 10 倍。
- 按消费量 + 订阅组合：客户付费的不是底层 Token，而是 Token 之上的工作流软件、AI 智能体的独特上下文、连接能力和数据访问权限。（来源：20250916）

6.3 大企业销售的特殊机遇

大企业做不好 AI 是创业公司的历史性机遇。最佳策略为：

策略	具体做法	案例
前置部署工程师（Forward Deployed Engineer）	走出去，与通常无法获得好软件的客户坐在一起，理解枯燥流程→转化为提示词→转化为数据集微调	Tactile 为银行构建实时决策 API——花旗和摩根大通各耗时 3-5 年、投入数千万美元自建失败
从内部拥护者切入	找到组织内对现状痛苦的决策者——他们今年可能升不了职甚至被解雇	Greenlight 在安永花费一年完全无法运行后全面部署
单点突破再扩展	先解决一个让客户痛苦到极点的具体问题，建立信任后再扩展到更大工作流	大多数 YC B2B AI 公司的路径

6.4 GTM 速度检查清单

[ ] 你的定价是按席位还是按结果？如果越成功收入越低，这是致命的。
[ ] 你能否直接找到「被现有系统折磨到想辞职」级别的用户？
[ ] 你的产品能不能在 bake-off 中直接击败在位者的「贴皮 AI」方案？
[ ] 你的销售对象是「被替代的人」还是「做购买决策的高层」？
[ ] 目标客户两年后能否用 Claude Code 自己搭建你的产品？如果能，你的价值在哪里？

常见错误

❌ 错误 1：「先卖后建」AI 创业

前 AI 时代正确的「先卖后建」在 AI 时代已经过时——因为创意空间被大幅拓展，大量以前不可能的想法现在变得可行。正确方法论是追随好奇心、站在技术前沿探索可能性。但注意：这不等于在没有任何验证的情况下盲目开发——验证的是「技术是否可能」，而非经典精益创业中的「需求是否真实存在」。（来源：20250528）

❌ 错误 2：做「ChatGPT 套壳」却没有大量具体业务逻辑

所有的 SaaS 软件本质上都是 MySQL 包装器——「ChatGPT 包装器」这个标签终将成为历史笑柄。区分十亿美元公司与 GPT-5 碾压对象的关键在于：是否包含大量具体的业务逻辑。如果下一个更好的模型可以轻易替代你的全部价值，你就没有护城河。（来源：20240208）

❌ 错误 3：因看不到远期护城河而放弃创业

「如果有人因为看不到远期护城河而决定不做一个创业想法，那是很愚蠢的。」——Jared Friedman。护城河本质上是防御性的，必须先有东西可守。先找到痛点足够痛苦的人，从零到一，护城河会在与客户合作、构建产品、确定所需数据的过程中自然浮现。（来源：20251003）

❌ 错误 4：追赶热门赛道但无独特洞察

如果大量创始人涌入同一方向（AI 客服、AI 法律等），差异化是生死线。但要注意「虚假拥挤」——AI 客服看上去无数公司在做，但真正能做到完全替代复杂工作流客服团队的公司不超过三四家，市场渗透率合计不到 1%。关键在于：你的产品是否真的好用？（来源：20241122）

❌ 错误 5：忽略「脏活」和系统集成

许多人低估构建完整垂直应用的投资。在提示工程之前还有大量「脏活」——连接客户专有系统、处理手写批注、歪斜扫描页甚至奇葩缩印格式。这些 OCR 软件选型与微调、专有数据标注、系统整合等构成比提示策略更难复制的护城河。千万不要只做黑客马拉松版本就以为产品完成了。（来源：20241004）

❌ 错误 6：氛围编码无测试就放用户进去

氛围编码（Vibe Coding）产出的代码 80% 情况下能用，但用户一碰就崩溃。AI 可以达到 100% 测试覆盖率，80-90% 是目前最佳实践。没有测试就放用户进去，比人类写的代码差 10 倍。（来源：20260508）

❌ 错误 7：将 AI 战略委托他人

创始人必须亲自站到前沿使用编程智能体（Claude Code / Cursor / Windsurf），发展自己的 AI 信念。不要将 AI 战略委托给 CTO 或 AI 团队——这是创始人级别的战略决策。没有哪个创始人因为过度使用 Claude Code 而丢失客户。（来源：20260424；20260527）

❌ 错误 8：按席位定价却让 AI 做得太好

如果你的 AI 做得越好、客户需要的员工越少，而你按员工数量收费——你正在主动缩减自己的收入。这是 AI 时代最隐蔽的商业逻辑陷阱。必须从一开始就采用按消费量、按结果或按任务量的定价。（来源：20251003）

YC 来源案例库

公司	赛道	核心成就	方法论启示
Cursor	AI 编程工具	每日冲刺周期——每天发布新功能，速度碾压大公司	「速度即护城河」教科书级案例
CaseText (CoCounsel)	法律 AI 代理	GPT-4 发布前秘密研发，上线两个月被汤森路透以 6.5 亿美元收购	测试驱动提示工程；从 70% 到 100% 才是壁垒
Gig ML	客户支持代理	为 Zepto 每天处理 30,000 个工单，取代上千人团队	垂直 AI 代理 10 倍逻辑——同时吃掉软件和人力预算
MCH	QA 代理	AI 完全替代 QA 团队，销售话术「你根本不需要 QA 团队」	当 AI 可完全替代团队时，销售对象转向高层决策者
Salient	金融催收	AI 语音代理处理汽车贷款催收	「向内深挖」——创始人在 Tesla 金融运营团队的经历
Sweet Spot	政府采购	自动进行政府采购投标的 AI 代理	「走出家门」——从朋友手动刷新招标网站中发现机会
Castle AI	金融 AI	在 AI 抵押贷款承销 bake-off 中击败老供应商	AI 原生的深度 vs 「贴了一层 AI」的浅度
Tactile	银行 AI	为银行构建实时决策 API——花旗和摩根大通 3-5 年数千万美元自建失败	创业公司用更少预算和更短时间完成大企业做不成的事
Legora	法律 AI	为律师构建 AI 工具，最终目标成为全球最大律所	全栈 AI 公司——不卖工具给律所，而是直接用 AI 竞争
Greenlight	合规 AI	在安永花一年无法运行后全面部署	咨询公司缺乏技术深度，产物沦为「委员会设计的骆驼」
StrongDM (EI 团队)	AI 原生开发	代码仓库中零手写代码，只有规格和测试	AI 软件工厂模式从理论验证为现实可行
Garry Tan (Gary's List)	Tokenmaxxing 实践	Posterous 三次构建：400万美元/6-7人/1.5年 → 200美元/1人/5天	Tokenmaxxing 约 400 倍效率提升
YC 内部	AI 原生组织	技能文件系统、默认公开代理对话、数据集中 PostgreSQL	即使是 AI 时代前成立的组织也可转型为「超级 AI 原生组织」
Replicate / Ollama / Deepgram	AI 基础设施	漫长等待后迎来拐点	基础设施路径需要极高耐心和资本
Perplexity / OpenClaw	个人 AI	去中心化 AI 工具	个人 AI 革命——拥有自己的提示词和数据

置信度与局限

置信度评估

高置信度（多位 YC 合伙人反复强调、多源交叉验证）：
- 创业方法论的范式转移（「先卖后建」已过时）
- 垂直 AI 代理 10 倍于 SaaS 的逻辑（软件 + 人力预算）
- 速度是 AI 创业早期唯一真正护城河
- Cursor 的每日冲刺周期
- Token 大于人数——最大化 Token 用量是 AI 时代的核心转变
- AI 改变了能力天花板而非仅仅效率
- 大企业做不好 AI 是创业公司的结构性机遇

中等置信度（单一来源或有未验证细节）：
- CaseText 的 6.5 亿美元收购细节（Jake Heller 自述，未独立交叉验证）
- 「300 家垂直 AI 代理独角兽」预测的具体时间范围和 10 倍计算方法论
- Pete Koomen 的每年 10 万-100 万美元 Token 费用估算（YC 规模组织，不同规模公司的预算可能不同）
- StrongDM EI 团队的「概率性满足阈值」的具体定义和指标

低置信度 / 不确定性：
- AGI 2-3 年时间线——Anthropic 对齐负责人提出，但 Aaron Levie 等其他讲者更聚焦商业窗口而非技术奇点
- AGI 到来后「软件完全商品化」「信任」等话题在 Anthropic 对齐负责人演讲中提出但因 raw 文件截断未充分展开
- Garry Tan 的 400 倍效率提升来自标准化逻辑代码行工具计算——具体方法论和博客文章链接未提供

核心局限

所有材料来自 YC 视角：YC 自身有明确的投资 thesis（偏好全栈 AI、高能动性小团队），可能存在系统性偏向。市场上其他投资者的观点（如 a16z、Sequoia）可能与 YC 存在差异。
窗口期判断存在高度不确定性：Aaron Levie 的「2024-2027 窗口」和 Anthropic 的「AGI 2-3 年」均为预判性判断，不排除技术发展速度超预期或低于预期的可能性。
案例聚焦 YC 投资组合：所有公司案例均来自 YC 投资或 YC 相关（CaseText、Cursor、Legora 等），可能不覆盖全行业其他路径（如开源模型创业、消费级 AI 等）。
「10 人千亿公司」尚为理论推演：虽然逻辑自洽且有云计算历史类比支撑，但截至目前尚无 10 人千亿市值的验证案例。
Tokenmaxxing 和 Thin Harness 范式仍在前沿演化：Garry Tan 和 Pete Koomen 的方法论在 2026 年 YC 内部仍在迭代中，最佳实践可能在半年内变化。
Anthropic 对齐负责人演讲数据缺失：raw 文件在 38 行处截断，后续关于「信任」「数据护城河」「AGI 后世界的竞争优势」等关键内容缺失。

补充建议

阅读 Hamilton Helmer 原书《七种力量》以获得护城河框架的完整理论基础
关注 Aaron Levie 推荐的三本书：《创新者的窘境》《跨越鸿沟》《蓝海战略》
持续关注 YC Light Cone 节目和 YC 官网更新——AI 创业方法论仍在快速演化中
参考 ai-and-startups topic page 获取更详细的 source quotes 和 tensions/differences 分析