软件创造的未来:Replit CEO Amjad Masad 访谈

封面

摘要

Replit CEO Amjad Masad 在 Y Combinator 的演讲中,深入阐述了软件创造领域的范式转变。他从计算历史出发——大型机时代只有专家才能操作,个人电脑最初被视为玩具,直到电子表格的出现才证明其实用价值——指出软件工程正在经历同样的民主化转型:从仅限专家参与的领域,走向人人皆可创造软件的未来。Replit 近九年来一直在构建在线集成开发环境(IDE)、语言运行时、沙盒环境、部署和云服务,当 AI 兴起后,团队决定将全部资源投入智能体(Agent)方向。Masad 详细介绍了 Agent 从 V1 到 V3 的演进路径,以及 V3 背后的三大技术支柱:端到端测试、采样与模拟、自动测试生成。他大胆预测应用软件的价格将趋近于零,传统 SaaS(Software as a Service)模式将被颠覆;未来公司的组织架构将从层级制走向网络化,员工将从高度专业化转向通才化;"主权个人"(Sovereign Individual)的概念将成真,创意与清晰的思维将成为最大的财富来源。在问答环节中,他进一步探讨了多智能体世界、人类创造力的不可替代性、文科教育的价值、以及如何避免模型自生成数据的累积误差等前沿话题。

计算的历史演变:从大型机到个人电脑

Amjad Masad 首先回顾了计算技术的历史脉络。大型机(Mainframe)是第一代主流计算设备,尽管"主流"在当时也意味着极小的用户群体——使用大型机需要深厚的专业训练。随后个人电脑(PC)问世,但最初它们只被视为玩具:人们购买 Mac 用来运行 MacPaint 之类的程序,并没有真正的商业应用场景。当时苹果公司甚至遭到嘲笑,直到电子表格(Excel Spreadsheet)的出现——这是第一款真正让计算机变得有用的软件。如今,个人电脑驱动着全球经济运转,数据中心里运行的也不过是 x86 架构的个人计算机。

这段历史揭示了一个规律:计算技术从少数专家的专属工具,经历"玩具"阶段,最终走向全民普及。Masad 认为,软件工程正在经历完全相同的转型。

软件工程的民主化转型

现代软件工程职业可以追溯到 20 世纪 70 年代 Unix 和 C 语言的兴起,那时人们开始接受系统化训练成为软件工程师。然而,成为一名合格的工程师仍需四到六年的大学教育,再加上两三年的在职培训才能真正胜任。Masad 指出,如今软件正在从"只有专家才能做"的事转变为"任何人都能做"的事,这正是 Replit 存在的意义。

Replit 已运营近九年,愿景始终是解决编程问题——让任何人都能编写软件。为此,团队构建了在线 IDE、语言运行时、在线沙盒环境、部署系统以及围绕这些的云服务。当 AI 技术出现后,Masad 意识到使命的终极表达是让用户不再需要亲自编码——代码本身就是阻碍更多人创造软件的瓶颈。

全面押注智能体

大约在 2023 年末至 2024 年初,Replit 决定将全部资源投入智能体(Agent)方向。彼时智能体勉强能工作,但通过观察 SWEBench(Software Engineering Benchmark)等基准测试的趋势,团队看到了明确的进步方向。SWEBench 是一个软件工程基准测试,包含来自 GitHub 主要仓库的问题、单元测试和拉取请求的最终状态,测试方式是将智能体放入环境中让其解决这些问题。

2022 年智能体几乎无法工作,2023 年开始有些起色,到 2024 年初趋势已经非常清晰:软件工程正在被自动化,或者至少是其中很大一部分正在被自动化。目前 SWEBench 的通过率已达 70%—80%。Masad 强调,虽然基准测试饱和并不意味着软件工程被完全自动化,但趋势不可逆转。

他对所有构建智能体创业公司的人给出了关键建议:要接受现在产品可能还很粗糙,因为两三个月后模型就会变得更好,届时产品会突然变得可行。当前正是智能体的黄金时代。

智能体的栖息地:基础设施才是难题

能写代码的智能体实际上是最简单的部分,真正的难题是围绕智能体的基础设施——Masad 称之为智能体的"栖息地"(Habitat)。智能体需要:

除了基础环境,要交付真正的软件还需要部署、数据库等服务。Masad 提到 Karpathy 之前的演讲也表达了类似观点——编码部分是简单的,但还有很多未解决的问题。不过 Masad 认为其中很多已经在 Replit 上得到了解决:

自治等级:从辅助到完全自主

Masad 用自动驾驶的等级类比来描述软件工程智能体的自治水平:

Replit Agent V3 的三大技术支柱

端到端测试与计算机使用

当前"计算机使用"(Computer Use)——即模型像人类一样在计算机上点击操作——虽然缓慢、昂贵且效果有限,但 Masad 认为这正是技术前沿,未来 3—6 个月将大幅改善。一旦应用测试能力就绪,智能体将能自主进行 QA(质量保证),从而独立工作 30 分钟到两小时。

采样与模拟

当前热议的"测试时计算"(Test Time Compute),如 o3、DeepSeek R1 等模型的核心洞见是:模型生成和消费的 Token 越多,就越智能。但这些模型大多在"原地思考",没有环境反馈。Replit 的方案是构建完全事务性、可逆的文件系统——每次文件编辑都是一个原子快照(Atomic Snapshot),支持极低成本的写时复制分叉(Copy-on-Write Fork)。智能体遇到难题时,可以分叉出多个并行实例,用不同方式同时求解,然后选出最优方案合并到主分支。这种"模拟"机制预计可将智能体可靠性提升两到三倍。

自动测试生成

Replit Agent 经常创建新功能后又破坏了旧功能(Claude Code、Cursor 等也有同样问题)。解决方案是让智能体为每个功能自动生成测试,并在每次变更时运行。但模型目前在生成单元测试方面仍然较差,且测试需要足够快以适应频繁变更,这仍是大量工作在进行中的领域。

应用软件将走向零成本

Masad 做出了一个大胆预测:所有应用软件的价格将趋于零。当任何人只需一个提示词(Prompt)就能生成任意复杂度的软件时,应用的价值将接近于零。他强调这不是说明天或明年就会发生,但以"年"为单位来看是确定的方向。

他用 Replit 同事 Kelsey 的故事作为例证:Kelsey 在 HR 部门工作,从未写过一行代码,但需要一款招聘管理软件(Org Chart Software),需要连接 ADP 薪资系统,还有一些定制需求。市面上的产品要价数万美元/年且不完全匹配需求。她用 Replit Agent 仅用三天就做出了现在 Replit 内部正在使用的招聘软件,甚至可以包装成 SaaS 产品对外销售。一位 HR 专业人员能自己做出软件,这在今天已经发生,而几年后这种能力将更加普及,彻底颠覆软件市场。

从专业化到通才化:工作的未来

自工业革命以来,经济趋向于高度专业化——一个人负责流水线上的一个环节,另一个人负责测试,再另一个人负责组装。这种专业化使人们更可替代,成为现代经济的基础。但当 HR 专业人员同时也能成为软件工程师、市场营销人员甚至任何角色时(因为 AI 智能体可以辅助完成任何工作),工作将变得不那么专业化、不再被隔离在职能孤岛中。

Replit 自身已在践行这一理念——产品团队由设计师、工程师和产品经理组成,但几乎总是同一个人身兼数职。未来组织的架构将更像网络而非层级,更像开源项目而非传统公司的营销部、销售部等分割结构。每位员工的使命不再是"写这封营销邮件"或"优化这个按钮",而是"让业务成功、为企业创造价值"。每个人都成为创业者。

《主权个人》与创意即财富

Masad 推荐了 20 世纪 80 年代出版的一本书《主权个人》(The Sovereign Individual),其中的预测令人惊叹:

"创意将成为财富。无论才能在何处涌现,都将获得前所未有的回报。在最大的财富来源是你头脑中的创意而非物质资本的环境中,任何思维清晰的人都可能变得富有。信息时代将是向上流动的时代。最聪明、最成功和最有野心的人将作为真正的主权个人崛起。"

Masad 认为可以将"信息时代"更新为"智能时代"。这本书还预测了加密货币、远程办公等趋势。中本聪(Satoshi)以一己之力创造了价值万亿美元的比特币,这正是"主权个人"的典型例证——一个人写论文、写代码、发布项目,就创造了巨大价值。

Masad 认为这种"创意即财富"的未来最令人兴奋之处在于:机会将变得普遍可及。无论你身在硅谷还是世界其他角落,只要思维清晰、能善用技术、能产生好创意,就可以进入 Replit 将想法转化为软件,开始成为"主权个人"。

他还指出,"十亿美元单人公司"的讨论有些偏离重点——真正有趣的是你将能极快地组建人团队和智能体团队,也能迅速解散。项目导向的临时公司可能在一两天内创建和解散。有时你以为在网上与另一个人合作,实际上那是别人部署的智能体。交易成本趋近于零时,全职雇佣的需求将减少——获取一个开发者(无论是软件智能体还是人类)就像现在叫一辆 Uber 一样简单,只需按一个按钮。

应用软件趋零,但平台不趋零

Masad 澄清:应用软件趋零不等于所有软件趋零。当前 Replit Agent 的模式是智能体制作软件、用户使用软件解决问题——但这些只是中间步骤。未来,智能体可以直接解决问题。Replit 必须从"专注于制作应用"转向"专注于用软件解决问题",成为一个通用问题求解器,这是公司长远生存的关键。

问答环节

多智能体世界与数据碎片化

来自斯坦福的 Chinat 问:未来人类是与单一智能体还是多个智能体交互?如何处理数据、记忆和上下文的碎片化?

Masad 认为将是多智能体世界。举例来说,一位在罕见案件领域拥有顶尖专长的律师,不会将自己的知识开源或卖给 Scale AI,而是将专业知识注入一个专用智能体来规模化自身。不同智能体将有不同上下文,就像今天去见律师需要提供自己的背景信息。Masad 再次强调 MCP 并不真正解决智能体间通信问题,这个领域需要更有趣的协议,也许这正是某个创业公司的机会。

人类还有什么可做?

有听众问:当 AI 系统能自动化几乎所有物理和认知任务时,人类还做什么?

Masad 认为这取决于对 AI 极限与人类独特性的世界观,某种程度上近乎宗教讨论。他的观点是:人类有特殊之处,当前 AI 存在根本局限——无法真正在分布外(Out of Distribution)泛化。AI 所能做的一切都需要数据中有所体现。面对真正新颖的问题或案例,仍需要人类的独创性。因此人类将更多处于创造者的位置,智能体的创造力是重组式的(将不同元素组合),而非创造全新的知识。但"创意即财富"意味着人们可以极快地产生和测试新想法。他不认为我们能很快达到"让智能体自己去找商业想法并测试所有想法"的阶段。

文科 vs STEM 教育

听众问:清晰思维和创意的重要性是否更支持博雅教育(Liberal Arts)而非 STEM 技能教育?

Masad 认为两者并非互斥,但博雅教育的价值确实在上升。当今工程师往往过于狭隘,很多人甚至不理解自己所在业务的全貌。未来人们需要更宽广的世界观和技能组合,同时保持科学思维方式仍然重要。

Replit 的技术栈创新

听众问:Replit 使用闭源模型,在技术栈哪个层面实现了让智能体自主工作一小时的创新?

Masad 回答:关键在于他所说的"智能体栖息地"。商业模型公司能训练出优秀的模型,但智能体公司需要提供让智能体生存和运行的基础设施。Replit 的核心创新是事务性和原子性的设计——对 Replit 计算环境的每次修改都与系统其他组件同步。用户可以在历史记录中查看之前的检查点(Checkpoint),并将应用恢复到任意状态。这种环境反馈和快速试错的能力,比单纯提升模型训练更能推动可靠性的上限。

通才型员工的职业路径

听众问:如何为通才型未来做准备?

Masad 建议:尽早加入创业公司。创始人获得最多通才经验,前几号员工次之,到第 100 号员工时通才体验已经大幅递减。即使是一家 B 轮公司的第 20 号员工,也比在 FAANG(大型科技公司)获得更多锻炼。但加入后还要主动寻求通才机会——不要等着被分配任务,而是以使命为导向:每天早上的目标不是完成待办事项,而是让公司更成功、更有价值。

可靠性与自主性的平衡

听众问:如何权衡长时间自主工作 vs 短时间更可靠的推理?

Masad 表示两者都很重要。可靠性方面,Replit 正在投资推理能力和并行智能体的试错机制(即采样与模拟);长时间自主方面,关键是测试——智能体工作时间越长,越容易偏离目标,需要沿途的测试护栏保持连贯性。随着收集更多失败数据,可以通过微调(Fine-tuning)或改进提示词(Prompt)和护栏来持续改善。

智能体领域的饱和度

听众问:某些智能体领域是否已经过度拥挤?

Masad 承认软件工程智能体领域确实竞争激烈,后来者需要真正创新的想法才能竞争。但很多领域如 HR、财务的智能体还很空白。他建议从自身兴趣和领域知识出发——创建智能体公司最好的方式是如果你自己就是该领域的从业者(如合规官),因为领域知识是构建智能体公司最重要的要素。

如果软件成本趋零,Replit 如何盈利?

听众问:如果软件成本走向零,Replit 的价值捕获不也趋零吗?

Masad 澄清:他说的是"应用软件"趋零,而非所有软件。软件仍将驱动世界,但很多将变得自主。Replit 需要成为通用问题求解器才能长远生存。在竞争方面,Replit 的优势在于全栈能力——从想法到部署和扩展的完整链路,而纯原型设计领域的竞争已经非常拥挤。

模型自生成数据的累积误差

听众问:代码由智能体编写、测试、审批,如何避免模型在自身生成数据上训练导致的累积误差?

Masad 的判断是:我们将很快转向类似 AlphaZero 风格的训练——先用传统大语言模型(LLM)在互联网数据上预训练,然后通过强化学习环境让下一代模型进行自我对弈(Self-play),在大量并行的方式中生成问题、求解并获得反馈。下一代软件智能体不会基于人类代码训练,因为人类代码将越来越少,这个问题必须解决,否则性能将严重停滞。

基础设施的开源计划

听众询问 Replit 的包管理器和 Nix 使用、写时复制快照等技术是否开源。

Masad 表示 Replit 已开源部分包管理器工作,是 NixOS 的重要贡献者。NixOS 是一个事务性操作系统生成器。文件系统相关的工作目前仍在积极开发中,但至少会公开讨论,并邀请感兴趣的人来 Replit 实习学习。