AI正在释放数百万新建造者的潜能

摘要
本期节目邀请到Emergent的联合创始人——双胞胎兄弟Makund和Madav Jar,分享他们如何通过AI代理(AI Agent)平台赋能非技术用户构建生产级软件的创业历程。Emergent于2024年夏季通过Y Combinator孵化,在上线仅8个月内已有超过700万款应用在其平台上构建,成为YC有史以来增长最快的公司之一。两位创始人从12岁开始编程,分别拥有Google和Amazon的深度学习团队背景,此前还创办了印度超本地化即时商务公司Dunzo。他们最初以自动化软件测试为切入点申请YC,随后发现验证(Verification)才是自动化全部软件工程的关键,进而转向通用编码代理。从纯研究公司到面向非技术用户的平台,Emergent的关键洞察是:只有复现顶尖工程团队的工作方式——代码审查、自动化测试、调试——才能真正实现软件工程的全面自动化。如今平台80%的用户没有任何编程经验,覆盖全球190多个国家。节目还深入探讨了先发优势与后发优势的辩证关系、多代理系统(Multi-Agent System)的架构创新,以及AI如何从根本上释放那些被技术壁垒阻挡的领域专家的创造力。
正文
从Dunzo到Emergent:创业基因
Makund和Madav是一对双胞胎兄弟,从12岁起就开始编程。两人来到美国攻读博士学位,Makund中途辍学加入Google,Madav则在Zens工作后创建了Amazon的深度学习团队。在创办Emergent之前,Makund在印度运营超本地化即时商务公司Dunzo,管理着300人的工程师团队,"Dunzo"在印度几乎成了一个动词——人们寄送东西时会说"Dunzo it"。在管理大型工程团队的过程中,他发现软件测试是快速交付的最大瓶颈,这为后来的创业方向埋下了种子。
从软件测试到通用编码代理
2023年底,两兄弟开始探索AI领域的创业机会,最初聚焦于自动化软件测试,并以这一想法申请了Y Combinator。然而许多VC认为这个想法太过疯狂。在构建测试代理的过程中,他们获得了一个关键洞察:验证(Verification)是让代理持续运行的核心循环——如果能解决验证问题,不仅能自动化测试,还能自动化整个软件工程流程。这一发现促使他们在2024年转向通用编码代理(General Coding Agent)领域。
登顶SWE-Bench基准
当时Devon刚刚发布,Lovable和Bolt尚未起步,整个AI编码代理领域仍处于极早期。Emergent团队将目标锁定在SWE-Bench基准测试上——这是当时衡量编码代理能力的核心基准。四名创始团队成员闭关攻关,仅用两个月就成为SWE-Bench全球第一。在这个过程中,他们发现了许多关于大语言模型(LLM)和代理系统的基本规律:多代理系统(Multi-Agent System)、记忆机制、代理间通信、测试时计算(Test-Time Compute)扩展等。Makund表示:"我们在Claude Code出现之前就在做Claude Code的事情",许多范式如多代理编排和不同路由策略都是他们的原创发现。
从企业市场到非技术用户
完成编码代理后,Emergent最初走的是企业市场路线——这是当时的"通行智慧"。然而他们在企业市场深耕了两三个月后发现进程太慢。与此同时,团队内部开始使用自己的平台构建内部工具和软件,并且观察到Lovable和Bolt的爆发式增长。他们决定将强大的编码代理重新包装,于2025年6月推出小规模Beta测试,结果一炮而红。从此,Emergent将重心转向非技术用户。如今平台80%的用户没有任何编程知识,却在其上构建了真正驱动业务运行的应用程序,用户遍布190多个国家。
先发优势与后发优势
针对AI领域先发优势是否重要的讨论,Makund认为每一代新模型都会带来重新想象世界的机会。从GPT-4时代的JSON解析问题,到Opus级别的长时域任务和多代理协调,后发者反而可以从不同起点出发,拥有更大的想象空间。Emergent起步时观察到,现有AI应用构建工具主要优化的是前端原型(Front-End Prototyping),而用户真正需要的是能上线运行的生产级应用。他们的核心洞察是:要自动化全部软件工程,就必须构建一个复现顶尖工程团队工作方式的平台——代码审查、自动化测试、调试缺一不可。
AI释放领域专家的创造力
节目开头Makund的一段话深刻概括了AI时代的本质转变:人们过多关注AI会取代工作、知识劳动消亡等负面叙事,却忽略了更重要的事实——如果你有自主性和意愿去创业、掌控自己的人生,AI正在大规模地赋能你。那些真正接近问题域(Problem Domain)的领域专家,过去被技术壁垒阻挡无法表达自己,如今借助AI代理终于可以将其洞察转化为可运行的软件产品。
多代理系统的架构创新
Emergent在多代理系统方面做出了开创性工作。他们发明了多代理编排(Multi-Agent Orchestration)的多种范式,包括不同路由策略、代理间通信协议和记忆机制。这些发现往往领先学术论文数月,体现了实践驱动的研发节奏。当前Opus级别的模型正在使超长时域任务(Long-Horizon Task)和多代理协调成为可能,这为平台能力的进一步跃升奠定了基础。
模型差异化与商品化趋势
在讨论不同AI模型的差异时,Makund指出:Opus是当之无愧的工作马(Workhorse),Codex在后端调试方面表现出色,Gemini则在前端方面见长。每种模型都有独特的行为特征,Emergent可以利用这些"尖刺"(即模型在特定任务上的突出能力)为用户提供最佳体验。他预测大多数模型最终将趋于商品化(Commoditized),在行为和价格上日趋接近,开源模型仅落后3到6个月。这意味着真正理解客户需求并据此构建产品的公司才能胜出。