YC 内部的 AI 实战手册

摘要
Y Combinator 合伙人 Pete Koomian(Optimizely 创始人)做客 Light Cone,首次公开分享了 YC 内部构建和使用 AI 工具的全套方法论。从大约一年前为财务团队构建简单的 SQL 查询代理开始,YC 逐步发展出一整套代理基础设施 (Agent Infrastructure),将这家成立于AI时代之前的机构转变为"超级AI原生组织"。核心洞察包括:(1) 不要把AI当作副驾驶 (Copilot),而要将其作为一切的构建层;(2) 当所有关键数据集中在一个 PostgreSQL 数据库中时,给予代理完整访问权限能释放惊人威力;(3) 技能文件 (Skill Files) 以两句话描述的形式,将组织中最优秀员工的经验编码为可被代理调用的知识;(4) 默认公开的代理对话广播机制既促进了组织学习,又提供了社会性约束;(5) "无马马车"(Horseless Carriages) 思维的批判——AI原生软件应该是代理包裹确定性工具,而非确定性软件包裹AI;(6) Chat(聊天)是最接近人类思维表达的界面,因此是AI交互的最佳形态;(7) 花费10万到100万美元的token费用是一种"时间扭曲"——今天投入的巨资将在两年后成为常态;(8) 未来软件将呈现"即时软件"(Just-in-time Software) 的形态,由代理根据需要即时构建。节目最终落脚于AI的集中化与去中心化之争——是走向只有五个国王控制一切的未来,还是走向让十亿人真正控制自己AI的个人计算时刻。
正文
起源:财务团队的痛点
Pete 回顾了大约一年前的起点。YC 长期以来一直运行在自己的软件上,这给予了巨大优势。当时,YC 的软件工程师与财务团队之间存在一个低效循环:财务团队描述复杂的工作流程(如记录日记账分录、登录定价轮次等),工程师将其封装为确定性软件,再交回财务团队。与此同时,代理式编程工具 (Agentic Coding Tools) 如 Windsurf、Cursor 正在兴起,Claude Code 也刚刚推出。Pete 在自己机器上使用这些工具时感受到了"超能力",与公司内部的传统软件开发方式之间形成了越来越大的鸿沟。
最初的动机很简单:为什么不给财务团队构建工具,让他们用英语提示词 (English Prompts) 而非 Ruby 代码来编码自己的工作流?于是第一版工具诞生了——一个让非技术人员(虽然是非常聪明的财务人员)也能用自然语言查询数据库的代理。它效果之好甚至让 Pete 自己都感到惊讶。
SQL 查询代理:第一个神奇时刻
第一个真正解锁可能性的工具是 Jared 构建的两个工具:让代理对 YC 的生产数据库执行只读 SQL 查询,以及读取模型文件。Jared 坦承他一开始感到"像是在破坏规则",因为最初的工具域非常窄,而他不满足于有限的权力,于是在深夜悄悄推送了一个给代理完整数据库访问权限的版本——结果运行得极其出色。
这预示了后来 OpenClaw 的发现:制约世界的正是对安全、隐私和可能出错的过度担忧。当你少一些顾虑,就会发现这些工具的力量惊人。这体现了工作中和个人使用之间的荒谬鸿沟——在公司里被限制在狭窄的盒子里操作,在家却用 Claude Code 做任何事情。
单一数据库的优势
为什么 SQL 查询代理如此强大?YC 拥有一个关键优势:所有软件都运行在自己的基础设施上,所有数据集中在一个 PostgreSQL 数据库中——每家被投资的公司、创始人信息、金融交易记录、内部 CRM 中的笔记,全部在同一个地方。当所有上下文集中一处,配合关于 schema 的少量额外信息,代理就可以回答关于业务的任意问题。比如"展示过去四个批次中所有投资了太空相关公司的投资者"。这种能力不仅让回答问题变得更容易,更戏剧性地增加了提问的数量和复杂度。
技能文件:组织的共享大脑
YC 的代理基础设施中最强大的创新之一是技能文件 (Skill Files)。每个技能用一个规范的两句话描述来定义——第一句话说明技能是什么,第二句话说明何时使用它。这看似简单,实则是一个组织学习工具:当 Pete 将自己关于创始人销售辅导的最佳实践写成技能文件后,任何人在使用代理时都能自动调用 Pete 多年积累的经验和直觉。
这本质上是一个"共享组织大脑"(Shared Organizational Brain)——最接近我们将大脑连接在一起的东西。新员工不再需要六个月的入职培训,他们自动获得公司的上下文和最佳实践者的隐性知识。那些"不好意思问的蠢问题"现在可以问代理了,这意味着更多问题被提出和解答,人员成长速度大幅提升。
默认公开的对话与高信任文化
YC 做了一个关键决策:所有代理对话默认对全体全职员工可见,并广播到 Slack 频道。这一决策并非轻松做出——"所有人都能看到一切,这样可以吗?"但结果证明是正确的:人们通过观察他人的使用方式学会了如何使用代理;透明的广播机制也提供了一种社会性约束,在高信任环境中有效地让私人信息保持私密。
Gary 指出这揭示了真正代理式、1000倍超级智能组织的两个必要特质:相对平等主义 (Egalitarian) 和默认信任 (Trust by Default)。大多数组织两者都不具备,但如果你想创建这种类型的组织,你必须将它们置于核心——尤其适合创业公司的小规模高信任团队。
时间扭曲:花10万住在2028年
Pete 估计一个组织需要花费每年10万到100万美元的token费用来实现这种AI原生运营。但这是一次性的时间扭曲 (Time Warp):你今天花10万甚至100万做的事,两年后将变得普及且成本低廉。就像90年代公司为员工购买昂贵的计算机——当竞争对手没有电脑时,拥有电脑就是超级力量。
这种投资带来的直接效果是"提升地板"——新员工的入职时间从六个月缩短到几乎即时,因为他们自动获得了公司最佳实践者的上下文和技能。
无马马车:AI 原生软件的正确形态
Pete 的著名文章《无马马车》(Horseless Carriages) 批判了一种普遍倾向:在现有软件中塞入一点AI功能,就像早期汽车被设计成"没有马的马车"一样。Gmail 的AI邮件撰写功能就是典型——提示词上下文被锁定和隐藏,用户无法修改。这是"安全主义"(Safetyism) 的体现——开发者认为自己应该控制一切,用户需要被保护。
真正的AI原生软件应该是代理包裹确定性工具 (Agent Wrapping Deterministic Tools),而非确定性软件包裹AI。Chat 作为界面实际上相当优秀——因为聊天是最接近人类语言的界面,而人类语言和书写是最接近思维表达的形式。当你越来越信任代理做更多工作时,你不需要太多UI来审查它的操作。
即时软件与开源代理框架
Gary 分享了他自己的经历:一月到二月间,他用 Claude Code 构建了50万行 Rails 代码——Gary's List。他用2013年的方式写代码,因为那是他上次编码的时候。现在他正在用 Gbrain(Gary's List 2.0)重写,这次基于开源框架:同样的功能,50万行 Rails 代码变成了大约1万行 TypeScript 和2000行 Markdown,而且更加动态。编辑主管可以在不碰代码的情况下即时修改内容。
Pete 提到了开源代理框架 Ams(基于 Claude Code 的开源编码代理)——一个极简的编码代理,你可以用 Ams 来修改和扩展 Ams 本身。这种自我扩展、自我参照的软件理念极具前瞻性。OpenClaw 就建立在 Ams 之上。未来越来越多的软件将以这种极简形式出现,然后通过代理逐步扩展。
集中化 vs 去中心化:AI 的未来走向
节目最后探讨了一个宏大议题:AI 是走向集中化还是去中心化?Gary 提出了两种截然不同的未来图景。
集中化场景如同1984:五个国王控制最先进的AI,垄断计算和数据中心,不允许你运行自己的提示词——就像个人电脑从未存在,世界上只有大型机和小型机。1960-70年代,普通人无法购买计算机,只有少数"祭司阶层"(Priesthood) 控制着生产资料。
去中心化场景则如同家酿计算机俱乐部 (Homebrew Computer Club)——Steve Jobs 和 Steve Wozniak 在车库里焊接电路板,卖出500台 Apple I。我们正处于"Apple I 时刻":正在创造原语、学习它们如何运作。但选择权在当下——ChatGPT 给了十亿用户有限的访问,MCP 被锁定;Claude 稍微开放一些;Perplexity Computer 可能是最好的版本,但仍然远不如 OpenClaw 和 Hermes Agent 能做到的。
真正的个人AI时刻意味着:运行你自己的软件、修改你自己的提示词、拥有你自己的私有代码仓库、选择你使用的模型(包括开放权重模型)。AI不应是"发生在你身上的事",而应是"你自身的延伸"——基于你所关心的,而非 Meta、Alphabet 或 OpenAI 所关心的。历史上技术从大型机到个人电脑到互联网的发展,本质上是个人赋权的故事,AI 也应该如此。但默认情况下,公司不会开放——默认是命令与控制,只有领导层获得这些工具。我们需要做出不同的选择,而正在观看的人将是构建这一切的人。