吴恩达:用AI加速构建

cover

摘要

在这场Y Combinator创业学校的演讲中,吴恩达(Andrew Ng)分享了他在AI Fund——一家平均每月孵化一家初创公司的风投工作室——积累的创业经验,核心主题围绕"速度"展开。他指出,执行速度是初创公司成功率的最强预测因子,而新兴AI技术正使创业速度大幅提升。

吴恩达首先描绘了AI技术栈的全景:从半导体、云服务商(Hyperscaler)、基础模型(Foundation Model)到应用层,强调最大的商业机会必然在应用层——因为应用层需要产生足够的收入来支撑整个技术栈。随后他深入讲解了智能体AI(Agentic AI)的崛起,对比了传统的线性提示词(Prompt)方式与迭代式智能体工作流(Agentic Workflow),后者在合规文件处理、医疗诊断、法律文件推理等场景中带来了质的飞跃。

演讲的核心内容包括四大加速策略:第一,聚焦具体想法(Concrete Ideas)——模糊的想法看似正确却无法快速执行,具体想法才能赋予团队速度;第二,利用AI编程助手加速工程——快速原型(Quick and Dirty Prototype)的构建速度已提升十倍以上,代码不再是珍贵资产,技术架构决策正从"单向门"变为"双向门";第三,加速产品反馈——从自身直觉到咖啡店陌生人的反馈,建立一套由快到慢的反馈战术组合;第四,深入理解AI技术——一个正确的技术判断可以避免数月的弯路,掌握更多AI构建模块(Building Blocks)能以组合方式指数级扩展创新能力。

在问答环节,吴恩达回应了AGI过度炒作、AI安全与负责任AI的区别、护城河(Moat)的相对重要性、Token成本、教育变革以及保护开源(Open Source)等话题,呼吁创业者专注于打造用户喜爱的产品,同时保持负责任的创新。

正文

AI技术栈与创业机会

吴恩达首先回应了一个常被问到的问题:创业机会在哪里?他展示了AI技术栈(AI Stack)的全景——最底层是半导体公司,其上是云服务商(Hyperscaler),再往上是AI基础模型公司(AI Foundation Model Company)。尽管媒体和社交媒体的炒作焦点大多集中在这几层技术层,但吴恩达指出,几乎从定义上讲,最大的机会必然在应用层(Application Layer)。原因很简单:应用层必须产生足够的收入,才能负担底层的基础模型、云服务和半导体成本。媒体对应用层的关注相对较少,但对于创业者而言,最大的商业机会恰恰在那里——当然,技术栈的每一层都存在机会。

智能体AI的崛起

关于最重要的AI技术趋势,吴恩达毫不犹豫地指出:智能体AI(Agentic AI)的兴起。一年半前他开始四处演讲试图说服人们AI智能体(AI Agent)可能成为现实时,并未预料到去年夏天一批营销人员会把这个术语当作标签到处张贴,使其几乎失去了部分含义。但从技术角度看,智能体AI确实令人兴奋且重要,同时也开辟了大量新的创业机会。

他对比了两种使用大语言模型(LLM)的方式。传统方式是给模型一个提示词(Prompt),让它一次性从第一个字写到最后一个字——就像要求一个人写文章时不允许使用退格键,必须一气呵成。人类在被迫以这种线性顺序写作时并不能发挥最佳水平,AI同样如此。尽管如此,当前的大语言模型在这种受限模式下依然表现惊人。

而智能体工作流(Agentic Workflow)则完全不同:你可以让AI系统先写出文章大纲,然后根据需要进行网页搜索(Web Research)获取资料并放入上下文,接着撰写初稿,再阅读初稿进行批判和修改——如此反复迭代。模型在这个循环中不断思考、研究、修正、再思考。虽然过程更慢,但最终产出的质量远高于线性生成。

在AI Fund的实践中,从提取复杂合规文件、医疗诊断到推理复杂法律文档,智能体工作流往往是项目成败的分水岭。大量有价值的企业仍需将现有或新的工作流映射到这些智能体工作流中来实现。吴恩达更新了AI技术栈的图景:过去一年中涌现出一个新的智能体编排层(Agentic Orchestration Layer),帮助应用构建者协调对底层技术的大量调用。编排层使得构建应用变得更加容易,但应用层仍是整个技术栈中最有价值的层这一基本结论依然成立。

聚焦具体想法

AI Fund只专注于具体想法(Concrete Ideas)。所谓具体的产品想法,是指细节足够清晰、工程师可以直接动手构建的想法。例如,"用AI优化医疗资产"——这其实不是具体想法,而是过于模糊。不同工程师会做出完全不同的东西,因为不够具体,就无法快速构建,也就没有速度。

相比之下,一个具体想法可能是:"开发软件让患者在线预约MRI设备时段以优化使用率。"吴恩达不确定这是否是个好想法——事实上已有企业在做这件事——但它是具体的,工程师可以快速构建。如果它是好想法,你会验证它;如果不是,你也会迅速发现。具体想法为你赢得了速度。

再比如"用AI做邮件个人生产力"——太多解读方式,不够具体。但如果有人说:"构建一个Gmail集成应用,用正确的提示词(Prompt)源过滤整个收件箱实现自动化"——这就是具体的,当天下午就能动手构建。

具体性带来速度,但令人困惑的是:模糊的想法往往获得大量赞誉。如果你告诉朋友"我们应该用AI优化医疗资产的使用",人人都会说"好主意!"——但这其实不是一个可以构建的好主意。当你的想法模糊时,你几乎总是"正确"的;但当你的想法具体时,你可能对也可能错——无论哪种都没关系,因为你能够更快地验证,这才是创业中最重要的。

在AI Fund,吴恩达要求团队聚焦具体想法,因为具体想法提供明确方向,团队能够快速构建、验证或证伪——无论结果如何都可以快速推进。发现好的具体想法通常需要领域专家(Subject Matter Expert)长期思考某个问题。以创建Coursera为例,在此之前他花了数年思考在线教育、与用户交谈、积累对优秀教育科技(EdTech)平台的直觉。Y Combinator有时称之为"穿越想法迷宫"(Wandering the Idea Maze)——经过长期思考后,那些深入思考过某个领域的人能够非常快速地做出决策。如果你问这样的专家"我应该构建这个功能还是那个功能",他们基于长期积累的直觉(Gut)做出的瞬间判断,往往是令人惊讶地好的决策机制。

吴恩达坦言,虽然他从事AI工作,人们可能以为他会说"我们需要数据"——他当然热爱数据——但对很多初创公司来说,获取数据实际上是慢速的决策机制。拥有良好直觉的领域专家往往是更快速的决策机制。

另一个关键模式:许多成功的初创公司在任何时刻都在追求一个非常清晰的假设,全力以赴构建并尝试推销一个明确的价值主张。初创公司没有资源同时押注十件事。选择一个,全力以赴;如果数据告诉你这个想法不可行,那就迅速转向(Pivot),追逐一个完全不同的具体想法。在AI Fund,他们经常坚定地追求一件事,直到市场告诉他们错了,然后以同等的决心转向追逐另一件事。但另一个观察是:如果每一条新数据都让你转向,那可能意味着你的知识基础太薄弱——如果每次与客户交谈都完全改变想法,很可能意味着你对那个行业了解还不够深,还无法形成高质量的具体想法。找到一个思考该领域更久的人,可能让你走上更好的道路、获得更快的速度。

AI编程助手与加速工程

构建反馈循环(Build Feedback Loop)正在因AI编程助手而发生剧变。构建应用时,最大的风险之一是客户接受度(Customer Acceptance)——许多初创公司并非因为无法构建产品而失败,而是因为构建了没人关心的东西。在AI Fund构建应用(尤其是应用层创业,而非深度技术/Deep Tech)的典型流程是:编写软件(工程任务/Engineering Task),获取用户反馈(产品管理任务/Product Management Task),根据反馈调整要构建的内容,回去继续编写软件——如此反复迭代,逼近产品市场契合(Product-Market Fit)。

AI编程助手正使快速工程(Rapid Engineering)成为可能——工程速度急剧提升,工程成本急剧下降,这改变了驱动初创公司在这条循环路径上前进的机制。

吴恩达将软件工作分为两大类。第一类是构建快速原型(Quick and Dirty Prototype)来测试想法——比如构建一个客户服务聊天机器人、用AI处理法律文档,先做一个粗糙的原型看看是否可行。第二类是编写和维护生产级软件(Production Software)——维护遗留代码库、大规模生产就绪的代码。根据不同分析师报告,在编写生产级代码方面,AI系统大概带来了30%到50%的提速——很难找到严谨的数据,但这是合理的估计。然而在构建快速原型方面,提速不是50%,而是轻松达到10倍甚至更多。

原因在于:独立原型与遗留软件基础设施的集成更少,对数据的需求更低,对可靠性、可扩展性甚至安全性的要求也低得多。吴恩达坦言这听起来不太好,但他经常对团队说"去写不安全的代码"——如果这个软件只在你自己的笔记本上运行,而你不打算恶意攻击自己的电脑,那么不安全的代码完全可以接受。当然,在验证有效之后、交付给他人之前,务必使其安全和可扩展——泄露个人身份信息(PII)或敏感数据是很有害的。但仅用于测试时,这完全没问题。

因此,他发现越来越多的初创公司系统性地通过构建20个原型来寻找可行的方案——他知道很多概念验证(Proof of Concept)未能走向生产,但当概念验证的成本足够低时,大量概念验证未能面世其实是可以接受的。

"快速行动,打破常规"(Move Fast and Break Things)这一口号因为确实打破了一些东西而声名狼藉,一些团队据此得出结论说不应该快速行动——吴恩达认为这是错误的。他倾向于告诉团队"快速行动,负责任地行动"(Move Fast and Be Responsible),而实际上有很多方法可以在负责任的同时快速行动。

关于AI编程助手的演进:三四年前是代码自动补全(Code Autocomplete),以GitHub Copilot为代表;然后是以Cursor、Windsurf为代表的AI集成开发环境(AI-enabled IDE)的窗口生成(Window Generation)时代——吴恩达本人大量使用Windsurf和Cursor;大约六七个月前,新一代高度智能体的编程助手(Highly Agentic Coding Assistant)开始出现,包括使用o3进行编程、Claude Code等——自从Claude 4发布以来,Claude Code表现出色(当然几个月后他可能使用不同的工具,工具在快速演进)。Codex也是新一代高度智能体编程助手的代表,持续推动开发者生产力增长。值得注意的是,如果你落后半代甚至一代工具,差距就会很大;他的团队相比三到六个月前已经在采用完全不同的软件工程方法。

一个令人惊讶的变化:过去我们认为代码是非常珍贵的制品(Artifact),因为创建它的成本很高;但随着软件工程成本下降,代码不再像过去那样是珍贵的制品。他的团队在过去一个月内完全重建了代码库三次——因为完全重建代码库、选择新的数据模式(Data Schema)已经不再那么困难,成本已经急剧下降。

杰夫·贝佐斯(Jeff Bezos)曾提出"双向门"(Two-Way Door)与"单向门"(One-Way Door)的概念。双向门是可以做出的决策,如果改变主意可以相对低成本地退回;单向门则是一旦做出决定,改变主意的成本极高或极其困难。选择软件架构和技术栈(Tech Stack)曾经是单向门——一旦基于某个技术栈构建、设定了数据库模式(Database Schema),很难更改。但吴恩达发现,他的团队现在更频繁地先基于某个技术栈构建,一周后改变主意就扔掉代码库在新技术栈上从头来过。他不想过度渲染——他们并非总是这样做,重建仍有成本——但团队确实在重新审视什么仍是单向门、什么已经变成双向门,因为软件工程成本大幅降低了。

赋能人人编程

吴恩达进一步提出:现在是让每个人都能用AI构建的时候了。过去一年,一些人建议别人不要学编程,理由是AI将自动化编程——他认为这将被证明是有史以来最糟糕的职业建议之一。因为当更好的工具使软件工程变得更简单时,应该有更多人去做,而不是更少。

几十年前,世界从打孔卡(Punch Cards)进步到键盘和终端,编程变简单了;从汇编语言(Assembly)进步到COBOL等高级语言(High-Level Language)时,甚至有人争辩说有了COBOL就不再需要程序员了——人们真的写了这样的文章——但当然那是错的。编程语言使编码变得更容易,更多人学会了编码。AI编程助手是下一个使编码变得更容易的工具,应该有更多人学习编程。

吴恩达提出了一个颇具争议的观点:每个岗位的人都应该学习编程。在他的团队中,首席财务官(CFO)、人才主管、招聘人员、前台接待——所有人都会编程,而且他看到他们在各自的岗位职能上都因为会编程而表现得更好。他承认自己可能走在了曲线前面,大多数企业还没到这一步,但在未来,赋能人人编程将让很多人变得更高效。

他用一个亲身经历来说明:在Coursera上教授"人人学生成式AI"(Generative AI for Everyone)课程时,团队需要用Midjourney生成背景美术素材。一位名叫Tommy的团队成员了解艺术史,他能够用流派(Genre)、调色板(Palette)、艺术灵感(Artistic Inspiration)来提示(Prompt)Midjourney,对生成的图像有非常精准的控制——最终团队使用了他生成的所有图像。相比之下,吴恩达自己不懂艺术史,他提示图像生成时只能写"请给我画漂亮的机器人图片",永远无法达到协作者那样的控制力,也就无法生成同样好的图像。

他认为,与计算机交互的未来最重要技能之一,就是能够精确告诉计算机你想要什么、让它为你执行。对计算机有更深理解的人,才能更好地指挥计算机达成你想要的结果。学习编程——不一定是自己写代码,而是引导AI为你编程——将在很长一段时间内仍然是实现这一目标的最佳方式。

产品反馈的加速

软件工程速度大幅提升后,另一个有趣动态出现了:产品管理工作——获取用户反馈、决定构建什么功能——正日益成为瓶颈。过去一年,他的多个团队开始抱怨瓶颈在产品工程和设计上,因为工程师变得太快了。

三四五年前,硅谷有一些虽带疑虑但被广泛采用的规则——1位产品经理(PM)对4到7位工程师的比例。随着工程师变得更快,产品管理工作并未以同等速度加速,这个比例正在发生变化。就在演讲前一天,他的一个团队首次在项目人员规划中提出了1位产品经理对0.5位工程师的方案——也就是两位产品经理对一位工程师。吴恩达仍不确定这个提议是否是个好主意,但他认为这预示了世界的发展方向。他发现能够编程的产品经理,或具有产品直觉的工程师,往往表现更好。

因为工程速度如此之快,如果你有好的策略来快速获取反馈以塑造构建方向的决策,就能进一步提升速度。吴恩达分享了一套从快到慢的产品反馈战术组合:

  1. 自己审视产品,凭直觉判断——如果你是领域专家,这出奇地有效。
  2. 请三位朋友或队友试用产品并给出反馈——稍慢一些。
  3. 请三到十个陌生人给反馈——他分享了一个重要技能:学会在咖啡店、旅行途中的酒店大堂等高人流场所,非常尊重地请陌生人试用产品并给予反馈。在他还不那么知名时这更容易,当人们认出你时会稍显尴尬,但他确实与团队在酒店大堂做出了大量产品决策。他发现在咖啡店里很多人其实不想工作,给他们一个分心的借口,他们非常乐意配合。
  4. 将原型发送给100位测试者——如果你有用户群的话。
  5. 将原型发送给更多用户——越来越慢的策略。
  6. A/B测试(A/B Testing)——与许多人想法相反,A/B测试实际上是他菜单中最慢的战术之一,因为上线本身就需要时间,还取决于你有多少用户。

一个关键要点:使用除第一种以外的任何策略时,团队会看数据做决策,但缺失的一环是——当他做A/B测试时,不仅用结果选择产品A或产品B,团队还会仔细审视数据来磨砺直觉(Hone Our Instincts),以提升使用第一种策略做出高质量决策的能力。坐下来认真思考:"我以为这个产品名会比那个更好,显然我的用户心智模型是错的"——用所有数据更新心智模型,提高凭直觉做出产品决策的速度和质量,这非常重要。

深入理解AI带来速度

最后一个加速维度:理解AI实际上让你走得更快。

吴恩达解释了原因。对于成熟技术如移动(Mobile),很多人使用智能手机已久,大致知道移动应用能做什么——包括非技术人员在内,很多人对移动应用有良好的直觉。看看成熟的岗位角色如销售、营销、人力资源(HR)、法务——都很重要、都很困难,但有足够多的营销人员做了足够久的营销,且营销策略在过去一年没有太大变化,所以有很多人非常擅长营销,这种知识相对分散。但AI是新兴技术(Emerging Technology),做好AI的知识并不普及,因此真正理解AI的团队相比不理解的团队具有优势。如果你有人力资源问题,你可以找到懂行的人;但如果是AI问题,知道如何正确处理可能让你领先于其他公司。

比如:客服聊天机器人能获得什么准确率?应该使用提示词(Prompt)还是微调(Fine-tune)?如何实现语音输出(Voice Output)的低延迟(Low Latency)?很多这类决策,做对了可能几天就解决问题,做错了可能追着死胡同(Blind Alley)跑三个月。

吴恩达分享了一个令人惊讶的观察:如果你有两种可能的架构决策,那就是一比特(One Bit)的信息。直觉上,如果你不知道正确答案,最多慢两倍——一比特信息似乎最多带来2倍加速。理论上这是对的,但在实践中,如果你选错了方向,你并非慢两倍,而是可能花10倍的时间追着死胡同跑。这就是为什么拥有正确的技术判断能让初创公司快得多。

另一个原因是,过去两年涌现了大量生成式AI工具和构建模块(GenAI Building Blocks)——部分列表包括:提示词工作流(Prompting Workflow)、评估(Eval)、护栏(Guardrails)、检索增强生成(RAG)、语音代理(Voice Agent)、异步编程(Async Programming)、ETL、嵌入(Embedding)、微调(Fine-tuning)、图数据库(Graph DB)、模型集成等。这是一长串精彩的构建模块,可以快速组合构建出一年前地球上没人能构建的软件,为初创公司创造了大量新机会。

吴恩达用积木(Lego)比喻来解释:如果你拥有一块基础白色积木(比如你知道如何写提示词),你可以构建一些东西。再获得第二块黑色积木(比如你还知道如何构建聊天机器人),可以构建更有趣的东西。获得蓝色积木、几块红色积木、一块黄色积木……你可以构建的东西以组合(Combinatorial)或指数(Exponential)方式增长。知道所有这些构建模块让你能以更丰富的组合来创新。

他提到DeepLearning.AI的课程目录在他眼中就是这样的积木集合——每学一门课程获得新的构建模块,就能组合出更多一两年前不可能实现的软件应用。

总结

吴恩达的最后一页幻灯片总结了核心观点:影响初创公司成功的因素很多,不仅只有速度。但在AI Fund所构建的初创公司中,管理团队的执行速度与其成功概率高度相关。获得速度的关键要素包括:

问答环节

人类应该开发工具还是学会更好地使用工具?

吴恩达认为AGI(通用人工智能)被过度炒作了,在很长一段时间内仍有很多事情人类能做而AI不能。未来最有力量的人,是那些能让计算机精确执行自己意愿的人。我们中有些人会构建工具,但也有很多工具是其他人构建的我们可以直接使用的。知道如何使用AI让计算机做你想做的事的人,将比不知道的人强大得多——不必担心人类无事可做。

算力的未来

吴恩达分享了一个判断炒作的框架:过去两年,少数公司为了推广、公关、融资和影响力目的炒作了一些叙事。因为AI太新,少数公司几乎什么话都敢说而无人事实核查。他的一个心理过滤器是:某些让这些企业看起来更强大的炒作叙事被放大了。

例如:"AI太强大,可能导致人类灭绝"——这很荒谬,但这是一个让某些企业看起来更强大的炒作叙事,被推波助澜后实际上帮助了这些企业的融资目标。"AI太强大,很快没人有工作了"——不是真的,但同样让这些企业看起来更强大而被炒作。"我们太强大了,训练一个新模型就能轻松消灭数千家初创公司"——也不是真的,Jasper确实遇到了麻烦,少量公司被淘汰了,但轻松消灭数千家初创公司远没那么容易。"AI需要太多电力,只有核电才够"——风能太阳能不行?这不是真的。至于GPU送上太空——去吧,但他认为地面GPU还有很大发展空间。这些炒作叙事被放大了,是对实际可能发生之事的扭曲。

最危险的偏见或过度炒作的叙事

吴恩达认为AI危险的叙事被过度炒作了。AI是一个出色的工具,但像任何强大的工具(如电力)一样,有很多有益的使用方式,也有一些有害的使用方式。他不太使用"AI安全"(AI Safety)这个词,不是因为认为应该构建危险的东西,而是因为安全不是技术的属性,而是如何应用它的属性。就像电机制造商无法保证没有人会在下游任务中不安全地使用它——电动机可以用来制造电动汽车,也可以用来制造智能炸弹——电机制造商无法控制下游如何使用。安全不是电动机的属性,而是如何应用的属性。AI同样如此——AI本身既非安全也非不安全,是应用方式使其安全或不安全。

因此,他更倾向于思考"负责任的AI"(Responsible AI)——是我们负责任还是不负责任地使用它,决定了用AI技术构建的东西最终是有害还是有益的。有时新闻中炒作的极端案例,比如一两天前《华尔街日报》关于"AI失控"的文章,将实验室中的边缘案例实验以与实验本身不成比例的方式耸人听闻化了。不幸的是,技术足够难以理解,很多人并不了解真相,这些炒作叙事就不断被放大——这还被用作反对开源软件的武器,这是非常令人遗憾的。

护城河与可复制性

对于"任何伟大产品都可以被竞争对手用代码几小时复制"的担忧,吴恩达回应:创业时有很多事情需要担心,他最关心的是——你是否在构建用户喜爱的产品?当你创建企业时有很多需要考虑的——推向市场渠道(Go-to-Market Channel)、竞争对手、技术护城河(Moat)——这些都很重要,但如果他只能聚焦一件事,那就是:你是否在构建用户真正想要的产品?在解决这个之前,构建有价值的业务非常困难。解决之后,其他问题才会浮现——你有触达客户的渠道吗?长期定价如何?你的护城河是什么?

他认为护城河往往被过度炒作。更多企业是先有产品,然后逐渐进化出护城河。消费品中品牌(Brand)相对更具防御性;如果你势头很强,对手就更难追上。企业产品中,如果进入企业的渠道很难,护城河可能更需考量。在AI Fund评估业务时,他们确实会做相当复杂的分析,撰写两到六页的叙述性备忘录(Narrative Memo)来分析这些因素,然后决定是否推进——所有这些都很重要。但他感觉在当下,机会的数量——即世界上可能构建但尚无人构建的事物——似乎远大于有能力构建它们的人数。在应用层,有大量无人涉足的空白领域(White Space)可以构建新事物。专注于构建人们想要、喜爱的产品,然后沿途解决其他问题——尽管其他问题同样需要沿途解决。

智能体工作流的Token成本与累积效应

关于Token成本与智能体工作流的累积效应,吴恩达给开发者最常见的建议是:第一近似下,不要担心Token成本。只有少数初创公司幸运到用户大量使用产品以至于Token成本成为问题——它确实可能成为问题,他确实在一些团队中看到用户喜欢产品后Token账单攀升到令人担忧的程度——但要达到Token使用成本成为问题的程度实际上非常困难。对于那些幸运到Token成本成为问题的团队,通常有工程解决方案将其降下来——通过提示词、微调、使用更小模型等方式优化。

他看到大量智能体工作流实际集成了很多不同步骤。例如构建客服聊天机器人,通常需要提示词、优化结果、构建评估(Eval)、构建护栏(Guardrail)、可能还需要检索增强生成(RAG)来获取信息反馈给用户——这些组件确实在组合增长。

一个重要建议:在架构软件时,使切换不同构建模块提供商的成本相对较低。例如他的很多产品构建在大语言模型(LLM)之上,但如果你问具体使用哪个模型,他有时并不确定——因为团队建立了评估体系,当新模型发布时,快速跑评估看新模型是否比旧模型更好,如果更好就切换。他们周复一周使用的模型,有时工程师甚至不通知他就切换了,因为评估显示新模型更好。基础模型的切换成本(Switching Cost)相对较低。他们经常这样架构软件——AI Suite就是他和朋友们开发的用于简化切换的开源工具。编排平台(Orchestration Platform)的切换成本稍高一些,但在构建模块选择上保持灵活性,即使越堆越高,也往往能让你走得更快。

AI与教育的未来

关于AI在教育中的两种范式——让教师更高效(自动评分等)与为每个学生提供个人AI导师——吴恩达认为:每个人感觉变革即将来临,但颠覆尚未到来。很多人在不同方向上实验——Coursera有Coursera Coach效果很好,DeepLearning.AI更专注于教授AI也有内置聊天机器人,很多团队实验自动评分(Autograding),DeepLearning.AI网站上甚至有一个吴恩达的分身(Avatar)可以对话。对于语言学习(如Speak、Duolingo),AI如何变革的方向更清晰。但在更广泛的教育领域,AI具体如何变革仍处于大量实验阶段。Khan Academy的Khanmigo他也在做一些合作,非常有前景。但坦率地说,他看到的是大量实验,最终形态尚不清晰。

他确实认为教育将走向高度个性化(Hyperpersonalized)——但工作流是分身?文本聊天机器人?什么工作流?几年前"AGI即将到来,一切都会变得简单"的炒作已经被证明是炒作。现实是工作很复杂——教师、学生、人们做的工作流非常复杂。未来十年,我们将持续审视需要完成的工作,弄清如何映射到智能体工作流上——教育是映射仍在进行中但尚未成熟到终态清晰的领域之一。我们应该继续努力。

如何平衡快速构建与负责任创新

吴恩达的回答简洁而深刻:审视你的内心——如果你正在构建的东西从根本上不能让大众更好,那就不要做。这听起来简单,但在当下真的很难做到。在AI Fund,他们因道德原因而非财务原因终止了多个项目——经济论证非常充分,但团队说"我们不希望这个东西存在于世界上",就据此终止了。他希望更多人这样做。

此外,他担心把每个人都带上。他看到各种非工程岗位的人如果懂AI,比不懂的人效率高得多——例如他营销团队中会编程的营销人员,表现远超不会编程的同事,后来大家都学了编程,整体水平都提高了。确保每个人都赋能使用AI构建,将是我们所有人工作的重要组成部分。

AI知识的普及与开源保护

关于是否需要向公众而非仅技术人员普及AI知识,吴恩达认为知识终将扩散——DeepLearning.AI正在努力赋能所有人用AI构建,很多人都在为此努力。他指出两个危险:一是没有足够快地把人们带上,他希望我们能解决这个问题。另一个更隐蔽的危险是:移动生态系统实际上没那么有趣,原因之一是有两个守门人(Gatekeeper)——Android和iOS,除非它们允许,否则你不能在移动端尝试某些事情,这阻碍了创新者。

AI的危险被某些企业用来试图关闭开源(Open Source)——因为一些企业非常乐意成为大规模基础模型的守门人。炒作AI的危险——虚假的危险——是为了让监管者通过法律,比如加州提出的SB 1047法案(谢天谢地被阻止了),该法案会施加极其繁重的监管要求,不会让任何人更安全,但会让初创公司极难发布开源和开放权重(Open Weight)软件。不平等的一个危险正在于:如果这些监管提案成功,最终导致少数守门人掌控一切——每个人都需要少数公司的许可才能微调模型或以某种方式提示——这才是真正会扼杀创新、阻止信息扩散的元凶,让大量初创公司无法负责任但自由地创新。

保护开源的战斗他们一直在赢,但战斗仍在继续,仍需持续努力保护开源。吴恩达以感谢结束演讲。