我们都对 Claude Code 上瘾了

cover

摘要

本期 The Light Cone 播客邀请到 Segment 创始人、OpenAI Codex 早期团队成员 Kelvin Frazier Owen,与 YC 合伙人 Gary、Jared 和 Harj 一起深度探讨编程代理 (Coding Agent) 革命。Gary 坦言自己十年前因进入管理层而停止编码,如今 Claude Code 让他重获"仿生膝盖",编码速度提升五倍。Kelvin 分享了从 OpenAI Codex 到 Claude Code 的工具迁移经历,揭示了一个反直觉的事实:20 年前的终端 (CLI) 技术竟然击败了所有现代 IDE,成为 AI 编程的最佳载体。对话深入讨论了 Claude Code 的上下文分割策略、Codex 的压缩架构差异、初创公司与大企业在采用编程代理上的鸿沟、底部分发 (Bottoms-up Distribution) 的威力、以及未来软件工程师的角色将从编码者转变为管理者与设计师。节目还触及了上下文窗口的局限性、测试驱动开发对代理的关键作用、以及一人公司可能颠覆大企业的未来图景。

正文

终端里的火箭推进器

Gary 回忆道,十年前他是一名马拉松跑者般的全职程序员,后来因进入"管理者模式" (Manager Mode) 而遭受了"灾难性膝伤"——停止了编码。然而过去九天使用 Claude Code 的体验,宛如获得了一个仿生膝盖 (Bionic Knee),让他能以五倍速度奔跑。"我重新解锁了曾经拥有的所有能力,"Gary 感叹道。

Kelvin 从 OpenAI Codex 项目的视角回顾了编程代理的演进。在 Cursor 以 IDE 插件形式推出时,Codex 选择了 CLI 路线。他们的核心洞见是:未来的编程将更像与同事对话——你发出一个问题,对方完成工作后带着 PR 回来。虽然方向正确,但最终所有人都选择了 CLI 而非 Web 界面。

为什么终端击败了 IDE

Claude Code 最令人惊讶的设计选择是终端界面。Kelvin 指出,这实际上是一个"怪异的复古未来" (Weird Retro Future)——20 年前的技术竟然打败了本应代表未来的 IDE。原因在于:IDE 让你聚焦于代码本身,你需要把所有状态装入脑海;而 CLI 将你与代码拉开距离,让你专注于指令和结果,反而给了产品更大的设计自由。

Gary 形容使用 Claude Code 的感觉是"在代码中飞行"——有各种进度指示器和状态更新,但代码本身不再是焦点。更重要的是,CLI 可以直接访问你的开发环境。Gary 透露他曾让 Claude Code 访问生产数据库调试并发问题,它能在嵌套五层的延迟任务 (Delayed Job) 中定位 Bug 并编写测试——这在沙盒环境中根本不可能做到。

Kelvin 还分享了一个有趣的产品案例:某桌面应用通过调用本地运行的 Claude Code,借助 MCP 服务器 (Model Context Protocol Server) 与桌面产品通信。你无需获得任何人的许可就能下载使用,这正是底部分发模式的威力——在变化极快的世界里,自上而下 (Top-down) 的销售太慢了,工程师直接安装使用才是王道。

Claude Code vs Codex:架构哲学之争

Kelvin 深入分析了 Claude Code 和 Codex 的根本架构差异。Claude Code 的核心优势在于上下文分割 (Context Splitting):当你下达任务时,它会派生探索子代理 (Explore Sub-agent),每个子代理在独立的上下文窗口中运行 grep 遍历文件系统。Anthropic 找到了一个关键洞见——给定一个任务,判断它是否适合放入单个上下文窗口,还是需要拆分为多个子任务。

而 Codex 的做法恰恰相反:它会在每一轮之后运行上下文压缩 (Compaction),因此在 CLI 中你会看到上下文占用百分比上下波动。Codex 可以持续运行很长时间,其架构天然适合长时任务。这种差异源于两家公司的基因:Anthropic 专注为人类构建工具(就像去五金店买材料建狗屋),而 OpenAI 倾向于训练最强模型让它以非人类方式完成长程任务(就像用 3D 打印机从头打印狗屋,可能做些奇怪的事但最终能工作)。

谁能成为编程代理的顶级用户

关于哪类工程师最能从编程代理中受益,Kelvin 认为资历越深收益越大——因为代理擅长将想法迅速转化为行动,资深工程师只需几句话的点拨就能释放巨大影响力。此外,具备架构判断力、能识别哪些变更是好是坏的工程师同样受益匪浅。

Kelvin 还提到了一个缺失的产品机会:类似 Conductor 的人类上下文管理工具——当你醒来时,告诉你昨晚完成了什么工作、需要做哪些决策、哪些深度思考待完成。他自己的 Claude Code 使用模式是:80% 的会话以计划模式 (Plan Mode) 开启,同时打开多个终端标签页并行推进,计划完善后再让 Claude 执行。

上下文窗口与测试的重要性

上下文窗口仍然是首要限制。当 Claude Code 委派给多个子上下文窗口时,每个窗口返回的只是摘要,并非全貌——对于过大的问题,压缩也无济于事。Kelvin 提到了一个实用的"金丝雀" (Canary) 技巧:在上下文中放入随机信息,当模型开始遗忘这些信息时,就意味着上下文已被污染。

Gary 则强调了测试的关键性。他在使用 Claude Code 的前两三天几乎不写测试,但某天决定追求 100% 测试覆盖率后,速度骤然提升——测试覆盖率足够好时,他甚至很少需要手动验证,因为测试会自动捕获问题。这与提示词工程领域的测试驱动开发 (Test-Driven Development) 理念不谋而合。

重构 Segment:如果用今天的工具

当被问及如果用当前工具重建 Segment 会是什么样子时,Kelvin 指出 Segment 最初的商业价值在于构建集成(将同一数据发送到 Mixpanel、KissMetrics、Google Analytics 等),但现在让 Claude Code 或 Codex 写这些集成代码已毫无门槛,那部分价值已骤降至零。

然而,Segment 管道运行、自动化业务流程、基于客户全貌的个性化营销编排等高阶价值依然存在。Kelvin 设想的未来是:每家公司注册时获得一份代码库副本,运行在自己的服务器上,想要修改任何东西只需在聊天窗口中告诉代理,它会编辑你的版本;当官方推送新功能时,代理会自动合并。

安全与自由的权衡

话题转向了 OpenAI 在 Codex 中对沙盒化的严苛态度。Kelvin 回忆在 OpenAI 时,每次发布模型都必须通过安全审查。他们曾测试提示注入 (Prompt Injection):团队的产品经理创建了一个包含明显提示注入的 GitHub Issue,然后让模型去修复——注入立刻就成功了。因此 OpenAI 选择在沙盒中运行一切、限制敏感文件访问、严格保护密钥。但对初创公司而言,安全往往让位于速度——你只想让它跑起来。

Gary 坦承自己不会跳过权限检查,喜欢阅读代理的每一步操作;而 Jared 则是 100% 的 YOLO 模式——完全跳过权限。YC 工程团队大约五五开。

未来展望

Kelvin 的终极愿景是:每个人都拥有自己的云端代理团队,像超级行政助理一样处理日常事务,而人类专注于面对面交流和创意碰撞。平均公司规模将变小,但数量会大幅增加,每个都做更多事情。

Gary 则思考了 Paul Graham 的"制造者日程 vs 管理者日程" (Maker Schedule vs Manager Schedule) 在新时代的演变——过去你需要至少四小时的完整时间块才值得开始编码,因为要把所有类名、函数名装入自己的"上下文窗口"需要数小时;现在你可以在会议间隙的十分钟片段里让代理工作。

Kelvin 的最后建议是:持续尝试,因为一切每隔几个月就会改变。最能从编程代理中获益的人将是更偏管理者思维的人——专注于引导流程方向,像设计师/艺术家一样决定产品该有什么、不需要什么,并持续思考自动化和上下文缺失的问题。