YC 内部的 AI 实战手册

cover

摘要

Y Combinator 合伙人 Pete Koomian（Optimizely 创始人）做客 Light Cone，首次公开分享了 YC 内部构建和使用 AI 工具的全套方法论。从大约一年前为财务团队构建简单的 SQL 查询代理开始，YC 逐步发展出一整套代理基础设施 (Agent Infrastructure)，将这家成立于AI时代之前的机构转变为"超级AI原生组织"。核心洞察包括：(1) 不要把AI当作副驾驶 (Copilot)，而要将其作为一切的构建层；(2) 当所有关键数据集中在一个 PostgreSQL 数据库中时，给予代理完整访问权限能释放惊人威力；(3) 技能文件 (Skill Files) 以两句话描述的形式，将组织中最优秀员工的经验编码为可被代理调用的知识；(4) 默认公开的代理对话广播机制既促进了组织学习，又提供了社会性约束；(5) "无马马车"(Horseless Carriages) 思维的批判——AI原生软件应该是代理包裹确定性工具，而非确定性软件包裹AI；(6) Chat（聊天）是最接近人类思维表达的界面，因此是AI交互的最佳形态；(7) 花费10万到100万美元的token费用是一种"时间扭曲"——今天投入的巨资将在两年后成为常态；(8) 未来软件将呈现"即时软件"(Just-in-time Software) 的形态，由代理根据需要即时构建。节目最终落脚于AI的集中化与去中心化之争——是走向只有五个国王控制一切的未来，还是走向让十亿人真正控制自己AI的个人计算时刻。

正文

起源：财务团队的痛点

Pete 回顾了大约一年前的起点。YC 长期以来一直运行在自己的软件上，这给予了巨大优势。当时，YC 的软件工程师与财务团队之间存在一个低效循环：财务团队描述复杂的工作流程（如记录日记账分录、登录定价轮次等），工程师将其封装为确定性软件，再交回财务团队。与此同时，代理式编程工具 (Agentic Coding Tools) 如 Windsurf、Cursor 正在兴起，Claude Code 也刚刚推出。Pete 在自己机器上使用这些工具时感受到了"超能力"，与公司内部的传统软件开发方式之间形成了越来越大的鸿沟。

最初的动机很简单：为什么不给财务团队构建工具，让他们用英语提示词 (English Prompts) 而非 Ruby 代码来编码自己的工作流？于是第一版工具诞生了——一个让非技术人员（虽然是非常聪明的财务人员）也能用自然语言查询数据库的代理。它效果之好甚至让 Pete 自己都感到惊讶。

SQL 查询代理：第一个神奇时刻

第一个真正解锁可能性的工具是 Jared 构建的两个工具：让代理对 YC 的生产数据库执行只读 SQL 查询，以及读取模型文件。Jared 坦承他一开始感到"像是在破坏规则"，因为最初的工具域非常窄，而他不满足于有限的权力，于是在深夜悄悄推送了一个给代理完整数据库访问权限的版本——结果运行得极其出色。

这预示了后来 OpenClaw 的发现：制约世界的正是对安全、隐私和可能出错的过度担忧。当你少一些顾虑，就会发现这些工具的力量惊人。这体现了工作中和个人使用之间的荒谬鸿沟——在公司里被限制在狭窄的盒子里操作，在家却用 Claude Code 做任何事情。

单一数据库的优势

为什么 SQL 查询代理如此强大？YC 拥有一个关键优势：所有软件都运行在自己的基础设施上，所有数据集中在一个 PostgreSQL 数据库中——每家被投资的公司、创始人信息、金融交易记录、内部 CRM 中的笔记，全部在同一个地方。当所有上下文集中一处，配合关于 schema 的少量额外信息，代理就可以回答关于业务的任意问题。比如"展示过去四个批次中所有投资了太空相关公司的投资者"。这种能力不仅让回答问题变得更容易，更戏剧性地增加了提问的数量和复杂度。

技能文件：组织的共享大脑

YC 的代理基础设施中最强大的创新之一是技能文件 (Skill Files)。每个技能用一个规范的两句话描述来定义——第一句话说明技能是什么，第二句话说明何时使用它。这看似简单，实则是一个组织学习工具：当 Pete 将自己关于创始人销售辅导的最佳实践写成技能文件后，任何人在使用代理时都能自动调用 Pete 多年积累的经验和直觉。

这本质上是一个"共享组织大脑"(Shared Organizational Brain)——最接近我们将大脑连接在一起的东西。新员工不再需要六个月的入职培训，他们自动获得公司的上下文和最佳实践者的隐性知识。那些"不好意思问的蠢问题"现在可以问代理了，这意味着更多问题被提出和解答，人员成长速度大幅提升。

默认公开的对话与高信任文化

YC 做了一个关键决策：所有代理对话默认对全体全职员工可见，并广播到 Slack 频道。这一决策并非轻松做出——"所有人都能看到一切，这样可以吗？"但结果证明是正确的：人们通过观察他人的使用方式学会了如何使用代理；透明的广播机制也提供了一种社会性约束，在高信任环境中有效地让私人信息保持私密。

Gary 指出这揭示了真正代理式、1000倍超级智能组织的两个必要特质：相对平等主义 (Egalitarian) 和默认信任 (Trust by Default)。大多数组织两者都不具备，但如果你想创建这种类型的组织，你必须将它们置于核心——尤其适合创业公司的小规模高信任团队。

时间扭曲：花10万住在2028年

Pete 估计一个组织需要花费每年10万到100万美元的token费用来实现这种AI原生运营。但这是一次性的时间扭曲 (Time Warp)：你今天花10万甚至100万做的事，两年后将变得普及且成本低廉。就像90年代公司为员工购买昂贵的计算机——当竞争对手没有电脑时，拥有电脑就是超级力量。

这种投资带来的直接效果是"提升地板"——新员工的入职时间从六个月缩短到几乎即时，因为他们自动获得了公司最佳实践者的上下文和技能。

无马马车：AI 原生软件的正确形态

Pete 的著名文章《无马马车》(Horseless Carriages) 批判了一种普遍倾向：在现有软件中塞入一点AI功能，就像早期汽车被设计成"没有马的马车"一样。Gmail 的AI邮件撰写功能就是典型——提示词上下文被锁定和隐藏，用户无法修改。这是"安全主义"(Safetyism) 的体现——开发者认为自己应该控制一切，用户需要被保护。

真正的AI原生软件应该是代理包裹确定性工具 (Agent Wrapping Deterministic Tools)，而非确定性软件包裹AI。Chat 作为界面实际上相当优秀——因为聊天是最接近人类语言的界面，而人类语言和书写是最接近思维表达的形式。当你越来越信任代理做更多工作时，你不需要太多UI来审查它的操作。

即时软件与开源代理框架

Gary 分享了他自己的经历：一月到二月间，他用 Claude Code 构建了50万行 Rails 代码——Gary's List。他用2013年的方式写代码，因为那是他上次编码的时候。现在他正在用 Gbrain（Gary's List 2.0）重写，这次基于开源框架：同样的功能，50万行 Rails 代码变成了大约1万行 TypeScript 和2000行 Markdown，而且更加动态。编辑主管可以在不碰代码的情况下即时修改内容。

Pete 提到了开源代理框架 Ams（基于 Claude Code 的开源编码代理）——一个极简的编码代理，你可以用 Ams 来修改和扩展 Ams 本身。这种自我扩展、自我参照的软件理念极具前瞻性。OpenClaw 就建立在 Ams 之上。未来越来越多的软件将以这种极简形式出现，然后通过代理逐步扩展。

集中化 vs 去中心化：AI 的未来走向

节目最后探讨了一个宏大议题：AI 是走向集中化还是去中心化？Gary 提出了两种截然不同的未来图景。

集中化场景如同1984：五个国王控制最先进的AI，垄断计算和数据中心，不允许你运行自己的提示词——就像个人电脑从未存在，世界上只有大型机和小型机。1960-70年代，普通人无法购买计算机，只有少数"祭司阶层"(Priesthood) 控制着生产资料。

去中心化场景则如同家酿计算机俱乐部 (Homebrew Computer Club)——Steve Jobs 和 Steve Wozniak 在车库里焊接电路板，卖出500台 Apple I。我们正处于"Apple I 时刻"：正在创造原语、学习它们如何运作。但选择权在当下——ChatGPT 给了十亿用户有限的访问，MCP 被锁定；Claude 稍微开放一些；Perplexity Computer 可能是最好的版本，但仍然远不如 OpenClaw 和 Hermes Agent 能做到的。

真正的个人AI时刻意味着：运行你自己的软件、修改你自己的提示词、拥有你自己的私有代码仓库、选择你使用的模型（包括开放权重模型）。AI不应是"发生在你身上的事"，而应是"你自身的延伸"——基于你所关心的，而非 Meta、Alphabet 或 OpenAI 所关心的。历史上技术从大型机到个人电脑到互联网的发展，本质上是个人赋权的故事，AI 也应该如此。但默认情况下，公司不会开放——默认是命令与控制，只有领导层获得这些工具。我们需要做出不同的选择，而正在观看的人将是构建这一切的人。