我们都对 Claude Code 上瘾了

cover

摘要

本期 The Light Cone 播客邀请到 Segment 创始人、OpenAI Codex 早期团队成员 Kelvin Frazier Owen，与 YC 合伙人 Gary、Jared 和 Harj 一起深度探讨编程代理 (Coding Agent) 革命。Gary 坦言自己十年前因进入管理层而停止编码，如今 Claude Code 让他重获"仿生膝盖"，编码速度提升五倍。Kelvin 分享了从 OpenAI Codex 到 Claude Code 的工具迁移经历，揭示了一个反直觉的事实：20 年前的终端 (CLI) 技术竟然击败了所有现代 IDE，成为 AI 编程的最佳载体。对话深入讨论了 Claude Code 的上下文分割策略、Codex 的压缩架构差异、初创公司与大企业在采用编程代理上的鸿沟、底部分发 (Bottoms-up Distribution) 的威力、以及未来软件工程师的角色将从编码者转变为管理者与设计师。节目还触及了上下文窗口的局限性、测试驱动开发对代理的关键作用、以及一人公司可能颠覆大企业的未来图景。

正文

终端里的火箭推进器

Gary 回忆道，十年前他是一名马拉松跑者般的全职程序员，后来因进入"管理者模式" (Manager Mode) 而遭受了"灾难性膝伤"——停止了编码。然而过去九天使用 Claude Code 的体验，宛如获得了一个仿生膝盖 (Bionic Knee)，让他能以五倍速度奔跑。"我重新解锁了曾经拥有的所有能力，"Gary 感叹道。

Kelvin 从 OpenAI Codex 项目的视角回顾了编程代理的演进。在 Cursor 以 IDE 插件形式推出时，Codex 选择了 CLI 路线。他们的核心洞见是：未来的编程将更像与同事对话——你发出一个问题，对方完成工作后带着 PR 回来。虽然方向正确，但最终所有人都选择了 CLI 而非 Web 界面。

为什么终端击败了 IDE

Claude Code 最令人惊讶的设计选择是终端界面。Kelvin 指出，这实际上是一个"怪异的复古未来" (Weird Retro Future)——20 年前的技术竟然打败了本应代表未来的 IDE。原因在于：IDE 让你聚焦于代码本身，你需要把所有状态装入脑海；而 CLI 将你与代码拉开距离，让你专注于指令和结果，反而给了产品更大的设计自由。

Gary 形容使用 Claude Code 的感觉是"在代码中飞行"——有各种进度指示器和状态更新，但代码本身不再是焦点。更重要的是，CLI 可以直接访问你的开发环境。Gary 透露他曾让 Claude Code 访问生产数据库调试并发问题，它能在嵌套五层的延迟任务 (Delayed Job) 中定位 Bug 并编写测试——这在沙盒环境中根本不可能做到。

Kelvin 还分享了一个有趣的产品案例：某桌面应用通过调用本地运行的 Claude Code，借助 MCP 服务器 (Model Context Protocol Server) 与桌面产品通信。你无需获得任何人的许可就能下载使用，这正是底部分发模式的威力——在变化极快的世界里，自上而下 (Top-down) 的销售太慢了，工程师直接安装使用才是王道。

Claude Code vs Codex：架构哲学之争

Kelvin 深入分析了 Claude Code 和 Codex 的根本架构差异。Claude Code 的核心优势在于上下文分割 (Context Splitting)：当你下达任务时，它会派生探索子代理 (Explore Sub-agent)，每个子代理在独立的上下文窗口中运行 grep 遍历文件系统。Anthropic 找到了一个关键洞见——给定一个任务，判断它是否适合放入单个上下文窗口，还是需要拆分为多个子任务。

而 Codex 的做法恰恰相反：它会在每一轮之后运行上下文压缩 (Compaction)，因此在 CLI 中你会看到上下文占用百分比上下波动。Codex 可以持续运行很长时间，其架构天然适合长时任务。这种差异源于两家公司的基因：Anthropic 专注为人类构建工具（就像去五金店买材料建狗屋），而 OpenAI 倾向于训练最强模型让它以非人类方式完成长程任务（就像用 3D 打印机从头打印狗屋，可能做些奇怪的事但最终能工作）。

谁能成为编程代理的顶级用户

关于哪类工程师最能从编程代理中受益，Kelvin 认为资历越深收益越大——因为代理擅长将想法迅速转化为行动，资深工程师只需几句话的点拨就能释放巨大影响力。此外，具备架构判断力、能识别哪些变更是好是坏的工程师同样受益匪浅。

Kelvin 还提到了一个缺失的产品机会：类似 Conductor 的人类上下文管理工具——当你醒来时，告诉你昨晚完成了什么工作、需要做哪些决策、哪些深度思考待完成。他自己的 Claude Code 使用模式是：80% 的会话以计划模式 (Plan Mode) 开启，同时打开多个终端标签页并行推进，计划完善后再让 Claude 执行。

上下文窗口与测试的重要性

上下文窗口仍然是首要限制。当 Claude Code 委派给多个子上下文窗口时，每个窗口返回的只是摘要，并非全貌——对于过大的问题，压缩也无济于事。Kelvin 提到了一个实用的"金丝雀" (Canary) 技巧：在上下文中放入随机信息，当模型开始遗忘这些信息时，就意味着上下文已被污染。

Gary 则强调了测试的关键性。他在使用 Claude Code 的前两三天几乎不写测试，但某天决定追求 100% 测试覆盖率后，速度骤然提升——测试覆盖率足够好时，他甚至很少需要手动验证，因为测试会自动捕获问题。这与提示词工程领域的测试驱动开发 (Test-Driven Development) 理念不谋而合。

重构 Segment：如果用今天的工具

当被问及如果用当前工具重建 Segment 会是什么样子时，Kelvin 指出 Segment 最初的商业价值在于构建集成（将同一数据发送到 Mixpanel、KissMetrics、Google Analytics 等），但现在让 Claude Code 或 Codex 写这些集成代码已毫无门槛，那部分价值已骤降至零。

然而，Segment 管道运行、自动化业务流程、基于客户全貌的个性化营销编排等高阶价值依然存在。Kelvin 设想的未来是：每家公司注册时获得一份代码库副本，运行在自己的服务器上，想要修改任何东西只需在聊天窗口中告诉代理，它会编辑你的版本；当官方推送新功能时，代理会自动合并。

安全与自由的权衡

话题转向了 OpenAI 在 Codex 中对沙盒化的严苛态度。Kelvin 回忆在 OpenAI 时，每次发布模型都必须通过安全审查。他们曾测试提示注入 (Prompt Injection)：团队的产品经理创建了一个包含明显提示注入的 GitHub Issue，然后让模型去修复——注入立刻就成功了。因此 OpenAI 选择在沙盒中运行一切、限制敏感文件访问、严格保护密钥。但对初创公司而言，安全往往让位于速度——你只想让它跑起来。

Gary 坦承自己不会跳过权限检查，喜欢阅读代理的每一步操作；而 Jared 则是 100% 的 YOLO 模式——完全跳过权限。YC 工程团队大约五五开。

未来展望

Kelvin 的终极愿景是：每个人都拥有自己的云端代理团队，像超级行政助理一样处理日常事务，而人类专注于面对面交流和创意碰撞。平均公司规模将变小，但数量会大幅增加，每个都做更多事情。

Gary 则思考了 Paul Graham 的"制造者日程 vs 管理者日程" (Maker Schedule vs Manager Schedule) 在新时代的演变——过去你需要至少四小时的完整时间块才值得开始编码，因为要把所有类名、函数名装入自己的"上下文窗口"需要数小时；现在你可以在会议间隙的十分钟片段里让代理工作。

Kelvin 的最后建议是：持续尝试，因为一切每隔几个月就会改变。最能从编程代理中获益的人将是更偏管理者思维的人——专注于引导流程方向，像设计师/艺术家一样决定产品该有什么、不需要什么，并持续思考自动化和上下文缺失的问题。