Michael Truell:23岁打造Cursor,挑战GitHub Copilot,给工程学生的建议

cover

摘要

Michael Truell是AI编程工具Cursor的联合创始人兼CEO。他在23岁时创立Anysphere公司,从机械工程AI副驾驶的失败尝试、端到端加密通讯系统的搁浅,一路辗转至最终聚焦AI编程领域。Cursor的诞生源于一个核心信念:未来五年内,所有软件开发都将通过AI模型进行,而当时的行业参与者并未认真对待这一愿景。Truell的编程启蒙始于中学时代——与兄弟尝试用Objective-C开发手机游戏,随后在高中时期通过构建机器狗项目深入强化学习 (Reinforcement Learning),甚至在资源受限的微控制器上从零实现了自己的神经网络库。2022年从MIT毕业后,四位联合创始人经历数月探索,最终在2023年初转向AI编程工具,最初从零构建代码编辑器,后切换至基于VS Code的方案。Cursor在2023年增长缓慢但扎实,团队不到10人,坚持产品驱动而非增长工程 (Growth Engineering),凭借代码库感知 (Codebase-aware)、下一编辑预测 (Next Edit Prediction) 等核心AI功能持续打磨。2024年实现从百万到上亿用户量级的爆发式增长,成为YC公司中使用率从个位数跃升至80%的现象级工具。Truell认为AI将经历一个"漫长的中间阶段" (Long Messy Middle),代码仍然重要,编程如同数学是通识教育,而年轻人应专注于自己真正感兴趣的事物、与值得尊敬的人共事。

正文

编程启蒙:从手机游戏到机器人

Michael Truell的编程之旅始于中学时代。某个寒假,他和兄弟想开发一款爆款手机游戏 (Hit Mobile Game)。他们在Google上搜索"如何创建游戏",得知需要下载Xcode,下载后面对的却是一堆古怪晦涩的Objective-C符号。兄弟很快放弃了编程,走上了绘画的道路;而Truell则买了一本Objective-C的书,坚持了下去,最终开始开发手机游戏——这就是他踏入编程世界的起点。

不过,他开发的手游并不太成功,反而是一个技术上最简单的应用火了——一个可以伪造《别踩白块》(Piano Tiles) 和《Flappy Bird》高分并分享给朋友的应用。这也给他上了一课:在创业中,代码并非一切。

此后,Truell与一位朋友对构建机器狗 (Robotic Dog) 产生了浓厚兴趣——他们想要一只可以通过正向和负向反馈(像训练真狗一样给予"奖励"或"惩罚")来学习的机器人。他们从Google搜索起步,一路探索了遗传算法 (Genetic Algorithm),了解到NEAT等将遗传算法用于进化神经网络的工作,最终接触到强化学习 (Reinforcement Learning, RL)。

虽然机器狗项目没有产生持久成果,但他们确实构建了几个有趣的机器人:一个多轴机械臂可以打乒乓球——加上合适的传感器后,通过正向和负向反馈可以教会它在看到球时挥拍;还有一个全向移动 (Kiwi Drive) 机器人,可以教它沿着线走。

从零实现神经网络库

这段经历之所以成为极好的机器学习教育,部分原因在于他们的"天真无知"——当时并不知道Torch和TensorFlow等现成框架的存在。由于机器人使用的是微控制器 (Microcontroller),内存极其有限,无法运行标准的机器学习库。因此,在构建机器狗的过程中,他们从零实现了自己的小型神经网络库 (Neural Network Library)。

Truell回忆道,他们当时并不真正理解内部原理,也不懂微积分,但一路摸索着重新实现了神经网络中的重要思想。这段经历教会了他们很多,但基础知识方面的许多空白,花了多年才逐步填补。

Anysphere的创立与早期探索

Truell很早就对创业产生兴趣,是Paul Graham (PG) 和Sam Altman等YC人物的忠实读者,从高中起就深受启发。

2021年,四位联合创始人(各自都有"机器狗时刻"——一位联合创始人在Google用大语言模型训练对比模型,另一位在学术界从事计算机视觉,还有人在Google做推荐系统)开始思考如何将AI兴趣转化为事业。两个关键时刻激发了他们:一是看到GitHub Copilot作为首个AI产品的出现,二是看到AI可预测地随规模扩展而变强的研究。

2022年初,四人举行为期一个月的"黑客马拉松" (Hackathon),围绕"选择一个知识工作领域,构建AI逐步成熟后的形态"这一主题进行探索。

机械工程AI副驾驶是他们第一个认真投入的想法:尝试训练模型预测工程师在SolidWorks或Fusion 360等CAD系统中的操作。选择这个领域是因为他们认为它"无聊、沉闷、竞争少"——一种"纸上谈兵的MBA思路",但实际上从一开始就是个糟糕的选择:团队中没有真正的机械工程师,而且那个领域的科学条件尚未成熟。他们花了大量精力爬取互联网上所有CAD模型、处理多种文件格式的转换、搭建训练基础设施、实验性地将扩展接入几乎不具备扩展性的CAD系统——但最终用户寥寥。

与此同时,两位联合创始人还在开发一个端到端加密 (End-to-End Encrypted) 通讯系统。因为像Signal和WhatsApp等应用只加密消息正文,但不隐藏谁在何时与谁通信——这对于不想信任通讯应用提供商的场景(如记者与政府线人联络)来说,元数据本身也是极为关键的信息。但这个系统在扩展性上存在严重权衡,无论是面向消费者还是B2B都未能获得牵引力。

转折:从失败中找到真正的方向

经过数月的挫折,团队开始反思:我们真的对这些领域感兴趣吗?是否存在我们从根本上更加兴奋的方向?

他们意识到,自己内心深处对编程的未来充满热情。他们也观察到行业中现有参与者的工作方式——他们有优秀的产品,也在不断改进,但并没有真正瞄准一个"编程将被全面自动化、软件开发方式彻底改变"的世界。而四位创始人相信,未来五年内,所有编程都将发生变化,所有软件开发都将通过模型来进行。

最初他们因为AI编程领域竞争激烈(2022年GitHub Copilot的年收入已达约1亿美元)而刻意避开,但在连续数月尝试其他方向却缺乏热情后,绝望推动他们直面竞争。他们先是考虑做一些利基工具——安全审计(检测代码中的未来CVE)、面向量化研究员的工具等——但在探索过程中,关于"Cursor应该成为用AI编程的最佳方式"的想法不断涌现。最终,凭借强烈的信念和热情,他们决定全力以赴。

从零构建编辑器到基于VS Code

2022年底至2023年初,团队开始构建Cursor。最初他们从零搭建自己的编辑器——虽然使用了CodeMirror、语言服务器 (Language Server) 等开源构建块,但远程SSH、Copilot集成、自动补全、语言服务器集成、面板系统等一切都需要自己实现。大约四周年后,他们构建出了可以作为自己日常驱动 (Daily Driver) 使用的版本;再过四周给了首批内测用户;最终公开上线,但当时仍然非常粗糙。

这段经历教会了他们两件事:

  1. AI功能形态的初步认知:最初只有一个快捷键调出"万能遥控器",AI需要自行判断用户想要什么——聊天回复?代码建议?代码库搜索?还是长时间/短时间思考?缺乏精细控制。他们意识到,以2022年底的技术水平,交互形态 (Form Factor) 必须有所不同。

  2. 编辑器复杂度的清醒认识:他们最初以为可以在几个月内做出功能完备的代码编辑器,但VS Code历经12年开发、是最早的TypeScript项目之一、有大量人员维护——现实证明这是条漫长得多的路。团队的时间最好专注于AI功能本身。因此,类似于浏览器基于Chromium渲染引擎的方式,他们切换到基于VS Code的方案。

模型训练:从抗拒到核心能力

在做机械工程AI副驾驶时,团队就已经进行过模型训练——因为当时市面上的现成模型不足以完成CAD预测任务,他们必须自行训练。他们曾在融资时引用最初的Codex论文(GitHub Copilot背后的首个自动补全模型),计算出其训练成本仅约10万美元。

然而,这段经历也让他们有些"受伤",因此在启动Cursor时,他们决定尽可能务实,不重新发明轮子,一开始完全不做模型训练。但随着2023年产品的逐步完善,模型训练成为了一个至关重要的产品杠杆 (Product Lever)——尤其是当用户规模增长后,产品数据可以用来改进产品,这成为公司一项核心能力的建设。

2023年:在沙漠中漫游

2023年对Cursor而言是缓慢但扎实的增长年。团队面临的核心挑战在于:他们所处的市场并没有一个明确的"下一步"——不像某些市场可以通过系统性地与用户交谈、列出问题、直接求解来推进。

作为终端用户应用 (End User Application),Cursor没有太多复杂性预算 (Complexity Budget)。很多功能理论上很有用,但如何在现有技术条件下实现、如何处理所有细节——前进路径并不清晰。Truell将这一时期形容为"在沙漠中漫游" (Wandering the Desert)。

早期用户群体的反馈也带来了方向性干扰:

关键的产品突破包括:代码库感知 (Codebase-aware) 功能、下一编辑预测 (Next Edit Prediction) 及其精度提升、预测速度提升、预测范围扩展(从单次编辑到编辑序列)、让AI模型在代码库中采取更多操作并不断加速——每一步改进都直接反映在增长数据中。

2023年底,团队仍不到10人——四位联合创始人都是出色的工程师,可以走得很远而不需要招聘。他们也在早期招聘上犯了一些错误,比应有的更加谨慎。

2024年:从百万到上亿的爆发

2024年是Cursor的爆发年。增长的核心驱动力始终是产品本身——在他们的市场中,产品越好,数据立刻就能体现出来。

增长的模式持续运转:代码库感知→下一编辑预测→精度提升→速度提升→范围扩展→AI自主操作加速——每一步改进都带来更多增长。Truell认为,他们身处一个终端用户偏好极为重要的市场,如果做出最好的产品,人们自然会听说并传播。

一个有趣的观察是YC批次 (YC Batch) 中的变化:2023年,可能只有个位数百分比的YC公司使用Cursor;到了2024年,这一数字跃升至约80%。增长如野火般蔓延。

早期增长的一个关键推动力是联合创始人在Twitter上的技术布道。在2022年团队还在做那些"命运多舛"的想法时,一位联合创始人就开始在互联网上发帖,通过深入阅读论文、思考前沿动态、公开分享见解来获取关注。例如,当时开源模型Flan-T5被多个AI项目采用,这些团队正是通过这位联合创始人的Twitter帖子了解到该模型的优势的。他成为了旧金山科技圈中极小众但极具影响力的"微名人" (Micro Celebrity),在产品早期帮忙布道。

但在获得初始用户后,团队在2023年"如僧侣般生活" (Lived Like Monks),完全专注于产品。期间曾有人提议"产品已经够好了,转向增长工程 (Growth Engineering) 吧",也尝试过两三周的冲刺,但与产品改进带来的增长相比,这些努力总是被冲刷殆尽。

AI与编程的未来:漫长的中间阶段

从一开始,Cursor团队就采取了一种"中间路线"的立场。2022年底,科技圈对AI的态度两极分化:一端是只优化现有产品形态的人,另一端是认为"除了AGI其他都不值得做"的人。

Truell始终认为:未来数十年将有大量极具价值的事物需要构建。AI将是一场变革性技术 (Transformative Technology),可能比近几个世纪的任何技术革命都更具颠覆性,但这需要数十年时间,需要整个行业的协同努力——许多独立能力需要逐一落地,才能真正实现"完全改变在计算机上构建软件"的终极状态。

对于专业工程师这一Cursor服务的核心用户群体,Truell认为:

给年轻人的建议

当被问及"如果有一个三年前的年轻Michael Truell,他现在应该做什么"时,Truell给出了简洁有力的建议:

  1. 做自己感兴趣的事——专注于自己真正感兴趣的事物。
  2. 与值得尊敬的人共事——与既享受相处、又由衷尊敬的人一起工作,并认真对待这一点。
  3. 不要被"打勾"思维所牵引——在学校中有太多力量把你拉向"打勾式" (Checking Boxes) 的路径,而非真正专注于长期构建自己感兴趣的事物。

演讲在热烈的掌声中结束。