软件创造的未来：Replit CEO Amjad Masad 访谈

摘要

Replit CEO Amjad Masad 在 Y Combinator 的演讲中，深入阐述了软件创造领域的范式转变。他从计算历史出发——大型机时代只有专家才能操作，个人电脑最初被视为玩具，直到电子表格的出现才证明其实用价值——指出软件工程正在经历同样的民主化转型：从仅限专家参与的领域，走向人人皆可创造软件的未来。Replit 近九年来一直在构建在线集成开发环境（IDE）、语言运行时、沙盒环境、部署和云服务，当 AI 兴起后，团队决定将全部资源投入智能体（Agent）方向。Masad 详细介绍了 Agent 从 V1 到 V3 的演进路径，以及 V3 背后的三大技术支柱：端到端测试、采样与模拟、自动测试生成。他大胆预测应用软件的价格将趋近于零，传统 SaaS（Software as a Service）模式将被颠覆；未来公司的组织架构将从层级制走向网络化，员工将从高度专业化转向通才化；"主权个人"（Sovereign Individual）的概念将成真，创意与清晰的思维将成为最大的财富来源。在问答环节中，他进一步探讨了多智能体世界、人类创造力的不可替代性、文科教育的价值、以及如何避免模型自生成数据的累积误差等前沿话题。

计算的历史演变：从大型机到个人电脑

Amjad Masad 首先回顾了计算技术的历史脉络。大型机（Mainframe）是第一代主流计算设备，尽管"主流"在当时也意味着极小的用户群体——使用大型机需要深厚的专业训练。随后个人电脑（PC）问世，但最初它们只被视为玩具：人们购买 Mac 用来运行 MacPaint 之类的程序，并没有真正的商业应用场景。当时苹果公司甚至遭到嘲笑，直到电子表格（Excel Spreadsheet）的出现——这是第一款真正让计算机变得有用的软件。如今，个人电脑驱动着全球经济运转，数据中心里运行的也不过是 x86 架构的个人计算机。

这段历史揭示了一个规律：计算技术从少数专家的专属工具，经历"玩具"阶段，最终走向全民普及。Masad 认为，软件工程正在经历完全相同的转型。

软件工程的民主化转型

现代软件工程职业可以追溯到 20 世纪 70 年代 Unix 和 C 语言的兴起，那时人们开始接受系统化训练成为软件工程师。然而，成为一名合格的工程师仍需四到六年的大学教育，再加上两三年的在职培训才能真正胜任。Masad 指出，如今软件正在从"只有专家才能做"的事转变为"任何人都能做"的事，这正是 Replit 存在的意义。

Replit 已运营近九年，愿景始终是解决编程问题——让任何人都能编写软件。为此，团队构建了在线 IDE、语言运行时、在线沙盒环境、部署系统以及围绕这些的云服务。当 AI 技术出现后，Masad 意识到使命的终极表达是让用户不再需要亲自编码——代码本身就是阻碍更多人创造软件的瓶颈。

全面押注智能体

大约在 2023 年末至 2024 年初，Replit 决定将全部资源投入智能体（Agent）方向。彼时智能体勉强能工作，但通过观察 SWEBench（Software Engineering Benchmark）等基准测试的趋势，团队看到了明确的进步方向。SWEBench 是一个软件工程基准测试，包含来自 GitHub 主要仓库的问题、单元测试和拉取请求的最终状态，测试方式是将智能体放入环境中让其解决这些问题。

2022 年智能体几乎无法工作，2023 年开始有些起色，到 2024 年初趋势已经非常清晰：软件工程正在被自动化，或者至少是其中很大一部分正在被自动化。目前 SWEBench 的通过率已达 70%—80%。Masad 强调，虽然基准测试饱和并不意味着软件工程被完全自动化，但趋势不可逆转。

他对所有构建智能体创业公司的人给出了关键建议：要接受现在产品可能还很粗糙，因为两三个月后模型就会变得更好，届时产品会突然变得可行。当前正是智能体的黄金时代。

智能体的栖息地：基础设施才是难题

能写代码的智能体实际上是最简单的部分，真正的难题是围绕智能体的基础设施——Masad 称之为智能体的"栖息地"（Habitat）。智能体需要：

虚拟机环境：理想情况下在云端运行，而非用户本地电脑，因为智能体可能做出危险操作，需要沙盒化（Sandboxed）隔离
可扩展性：Replit 这样的产品需要支持数百万用户
多语言和多包支持：智能体基于标准 Linux 环境训练，需要使用 Shell、读写文件、安装系统级和语言级包
开放环境：当前很多智能体开发环境过于受限，需要尽可能接近真实软件工程师的工作环境

除了基础环境，要交付真正的软件还需要部署、数据库等服务。Masad 提到 Karpathy 之前的演讲也表达了类似观点——编码部分是简单的，但还有很多未解决的问题。不过 Masad 认为其中很多已经在 Replit 上得到了解决：

认证（Auth）：智能体不擅长处理认证，Replit 内置的认证服务只需一行代码即可启用
部署与域名：一键部署应用并绑定自定义域名
密钥管理（Secrets Management）：安全使用 API Key
后台任务（Background Jobs）：应用需要在后台持续运行，尤其在智能体时代
存储（Storage）：智能体需要从网络抓取图像、文档等并存储
通用模型访问（Universal Model Access）：即将推出，任何 AI 模型在 Replit 中直接可用
支付（Payments）：不仅用户需要付费，智能体未来也需要拥有"钱包"来购买服务
智能体间协作：智能体需要能够雇佣其他智能体，Masad 认为 MCP（Model Context Protocol）更像传统 RPC 协议，并非真正的智能体间通信方案

自治等级：从辅助到完全自主

Masad 用自动驾驶的等级类比来描述软件工程智能体的自治水平：

等级一：语言服务器（Language Server），即 VS Code 中的 IntelliSense，类似车道保持辅助
等级二：AI 代码补全，如 Copilot，类似自适应巡航
等级三：Replit Agent V2（约 3.5 级），可独立工作 10—15 分钟，但仍需用户偶尔输入以测试应用
等级四：Replit Agent V3，接近完全自主，仍需少量关注
等级五（未来）：可以同时启动上千个智能体解决上千个问题，95% 的可靠率，任何工程师或产品经理都能像指挥上千名工程师一样工作

Replit Agent V3 的三大技术支柱

端到端测试与计算机使用

当前"计算机使用"（Computer Use）——即模型像人类一样在计算机上点击操作——虽然缓慢、昂贵且效果有限，但 Masad 认为这正是技术前沿，未来 3—6 个月将大幅改善。一旦应用测试能力就绪，智能体将能自主进行 QA（质量保证），从而独立工作 30 分钟到两小时。

采样与模拟

当前热议的"测试时计算"（Test Time Compute），如 o3、DeepSeek R1 等模型的核心洞见是：模型生成和消费的 Token 越多，就越智能。但这些模型大多在"原地思考"，没有环境反馈。Replit 的方案是构建完全事务性、可逆的文件系统——每次文件编辑都是一个原子快照（Atomic Snapshot），支持极低成本的写时复制分叉（Copy-on-Write Fork）。智能体遇到难题时，可以分叉出多个并行实例，用不同方式同时求解，然后选出最优方案合并到主分支。这种"模拟"机制预计可将智能体可靠性提升两到三倍。

自动测试生成

Replit Agent 经常创建新功能后又破坏了旧功能（Claude Code、Cursor 等也有同样问题）。解决方案是让智能体为每个功能自动生成测试，并在每次变更时运行。但模型目前在生成单元测试方面仍然较差，且测试需要足够快以适应频繁变更，这仍是大量工作在进行中的领域。

应用软件将走向零成本

Masad 做出了一个大胆预测：所有应用软件的价格将趋于零。当任何人只需一个提示词（Prompt）就能生成任意复杂度的软件时，应用的价值将接近于零。他强调这不是说明天或明年就会发生，但以"年"为单位来看是确定的方向。

他用 Replit 同事 Kelsey 的故事作为例证：Kelsey 在 HR 部门工作，从未写过一行代码，但需要一款招聘管理软件（Org Chart Software），需要连接 ADP 薪资系统，还有一些定制需求。市面上的产品要价数万美元/年且不完全匹配需求。她用 Replit Agent 仅用三天就做出了现在 Replit 内部正在使用的招聘软件，甚至可以包装成 SaaS 产品对外销售。一位 HR 专业人员能自己做出软件，这在今天已经发生，而几年后这种能力将更加普及，彻底颠覆软件市场。

从专业化到通才化：工作的未来

自工业革命以来，经济趋向于高度专业化——一个人负责流水线上的一个环节，另一个人负责测试，再另一个人负责组装。这种专业化使人们更可替代，成为现代经济的基础。但当 HR 专业人员同时也能成为软件工程师、市场营销人员甚至任何角色时（因为 AI 智能体可以辅助完成任何工作），工作将变得不那么专业化、不再被隔离在职能孤岛中。

Replit 自身已在践行这一理念——产品团队由设计师、工程师和产品经理组成，但几乎总是同一个人身兼数职。未来组织的架构将更像网络而非层级，更像开源项目而非传统公司的营销部、销售部等分割结构。每位员工的使命不再是"写这封营销邮件"或"优化这个按钮"，而是"让业务成功、为企业创造价值"。每个人都成为创业者。

《主权个人》与创意即财富

Masad 推荐了 20 世纪 80 年代出版的一本书《主权个人》（The Sovereign Individual），其中的预测令人惊叹：

"创意将成为财富。无论才能在何处涌现，都将获得前所未有的回报。在最大的财富来源是你头脑中的创意而非物质资本的环境中，任何思维清晰的人都可能变得富有。信息时代将是向上流动的时代。最聪明、最成功和最有野心的人将作为真正的主权个人崛起。"

Masad 认为可以将"信息时代"更新为"智能时代"。这本书还预测了加密货币、远程办公等趋势。中本聪（Satoshi）以一己之力创造了价值万亿美元的比特币，这正是"主权个人"的典型例证——一个人写论文、写代码、发布项目，就创造了巨大价值。

Masad 认为这种"创意即财富"的未来最令人兴奋之处在于：机会将变得普遍可及。无论你身在硅谷还是世界其他角落，只要思维清晰、能善用技术、能产生好创意，就可以进入 Replit 将想法转化为软件，开始成为"主权个人"。

他还指出，"十亿美元单人公司"的讨论有些偏离重点——真正有趣的是你将能极快地组建人团队和智能体团队，也能迅速解散。项目导向的临时公司可能在一两天内创建和解散。有时你以为在网上与另一个人合作，实际上那是别人部署的智能体。交易成本趋近于零时，全职雇佣的需求将减少——获取一个开发者（无论是软件智能体还是人类）就像现在叫一辆 Uber 一样简单，只需按一个按钮。

应用软件趋零，但平台不趋零

Masad 澄清：应用软件趋零不等于所有软件趋零。当前 Replit Agent 的模式是智能体制作软件、用户使用软件解决问题——但这些只是中间步骤。未来，智能体可以直接解决问题。Replit 必须从"专注于制作应用"转向"专注于用软件解决问题"，成为一个通用问题求解器，这是公司长远生存的关键。

问答环节

多智能体世界与数据碎片化

来自斯坦福的 Chinat 问：未来人类是与单一智能体还是多个智能体交互？如何处理数据、记忆和上下文的碎片化？

Masad 认为将是多智能体世界。举例来说，一位在罕见案件领域拥有顶尖专长的律师，不会将自己的知识开源或卖给 Scale AI，而是将专业知识注入一个专用智能体来规模化自身。不同智能体将有不同上下文，就像今天去见律师需要提供自己的背景信息。Masad 再次强调 MCP 并不真正解决智能体间通信问题，这个领域需要更有趣的协议，也许这正是某个创业公司的机会。

人类还有什么可做？

有听众问：当 AI 系统能自动化几乎所有物理和认知任务时，人类还做什么？

Masad 认为这取决于对 AI 极限与人类独特性的世界观，某种程度上近乎宗教讨论。他的观点是：人类有特殊之处，当前 AI 存在根本局限——无法真正在分布外（Out of Distribution）泛化。AI 所能做的一切都需要数据中有所体现。面对真正新颖的问题或案例，仍需要人类的独创性。因此人类将更多处于创造者的位置，智能体的创造力是重组式的（将不同元素组合），而非创造全新的知识。但"创意即财富"意味着人们可以极快地产生和测试新想法。他不认为我们能很快达到"让智能体自己去找商业想法并测试所有想法"的阶段。

文科 vs STEM 教育

听众问：清晰思维和创意的重要性是否更支持博雅教育（Liberal Arts）而非 STEM 技能教育？

Masad 认为两者并非互斥，但博雅教育的价值确实在上升。当今工程师往往过于狭隘，很多人甚至不理解自己所在业务的全貌。未来人们需要更宽广的世界观和技能组合，同时保持科学思维方式仍然重要。

Replit 的技术栈创新

听众问：Replit 使用闭源模型，在技术栈哪个层面实现了让智能体自主工作一小时的创新？

Masad 回答：关键在于他所说的"智能体栖息地"。商业模型公司能训练出优秀的模型，但智能体公司需要提供让智能体生存和运行的基础设施。Replit 的核心创新是事务性和原子性的设计——对 Replit 计算环境的每次修改都与系统其他组件同步。用户可以在历史记录中查看之前的检查点（Checkpoint），并将应用恢复到任意状态。这种环境反馈和快速试错的能力，比单纯提升模型训练更能推动可靠性的上限。

通才型员工的职业路径

听众问：如何为通才型未来做准备？

Masad 建议：尽早加入创业公司。创始人获得最多通才经验，前几号员工次之，到第 100 号员工时通才体验已经大幅递减。即使是一家 B 轮公司的第 20 号员工，也比在 FAANG（大型科技公司）获得更多锻炼。但加入后还要主动寻求通才机会——不要等着被分配任务，而是以使命为导向：每天早上的目标不是完成待办事项，而是让公司更成功、更有价值。

可靠性与自主性的平衡

听众问：如何权衡长时间自主工作 vs 短时间更可靠的推理？

Masad 表示两者都很重要。可靠性方面，Replit 正在投资推理能力和并行智能体的试错机制（即采样与模拟）；长时间自主方面，关键是测试——智能体工作时间越长，越容易偏离目标，需要沿途的测试护栏保持连贯性。随着收集更多失败数据，可以通过微调（Fine-tuning）或改进提示词（Prompt）和护栏来持续改善。

智能体领域的饱和度

听众问：某些智能体领域是否已经过度拥挤？

Masad 承认软件工程智能体领域确实竞争激烈，后来者需要真正创新的想法才能竞争。但很多领域如 HR、财务的智能体还很空白。他建议从自身兴趣和领域知识出发——创建智能体公司最好的方式是如果你自己就是该领域的从业者（如合规官），因为领域知识是构建智能体公司最重要的要素。

如果软件成本趋零，Replit 如何盈利？

听众问：如果软件成本走向零，Replit 的价值捕获不也趋零吗？

Masad 澄清：他说的是"应用软件"趋零，而非所有软件。软件仍将驱动世界，但很多将变得自主。Replit 需要成为通用问题求解器才能长远生存。在竞争方面，Replit 的优势在于全栈能力——从想法到部署和扩展的完整链路，而纯原型设计领域的竞争已经非常拥挤。

模型自生成数据的累积误差

听众问：代码由智能体编写、测试、审批，如何避免模型在自身生成数据上训练导致的累积误差？

Masad 的判断是：我们将很快转向类似 AlphaZero 风格的训练——先用传统大语言模型（LLM）在互联网数据上预训练，然后通过强化学习环境让下一代模型进行自我对弈（Self-play），在大量并行的方式中生成问题、求解并获得反馈。下一代软件智能体不会基于人类代码训练，因为人类代码将越来越少，这个问题必须解决，否则性能将严重停滞。

基础设施的开源计划

听众询问 Replit 的包管理器和 Nix 使用、写时复制快照等技术是否开源。

Masad 表示 Replit 已开源部分包管理器工作，是 NixOS 的重要贡献者。NixOS 是一个事务性操作系统生成器。文件系统相关的工作目前仍在积极开发中，但至少会公开讨论，并邀请感兴趣的人来 Replit 实习学习。