Bob McGrew:AI 智能体与通往 AGI 之路

cover

摘要

本文整理自 Y Combinator 对 OpenAI 前首席研究官 Bob McGrew 的深度访谈。McGrew 从自身经历出发,回顾了 OpenAI 早期的研究探索——从机器人手解魔方、Dota 2 游戏智能体,到 Alec Radford 独自坚持数年催生 GPT-1 的故事。他阐述了 OpenAI 独特的研究文化:既非 DeepMind 式的集中规划,也非 Google Brain 式的自由放任,而是在"有方向性观点"与"允许探索"之间取得平衡。访谈的核心议题围绕"规模化定律 (Scaling Laws)"展开:McGrew 认为,AI 进步由多条 S 曲线叠加驱动——预训练 (Pre-training) 的 S 曲线正触及数据墙 (Data Wall),而推理 (Reasoning) 与测试时计算 (Test-Time Compute) 构成了新的增长引擎,为可靠智能体 (Agents) 的实现铺平了道路。他提出了一个关键经验法则:可靠性每提升一个九(从 90% 到 99%,再到 99.9%),所需计算量约增加一个数量级,而推理能力使模型能以"更长时间思考"换取更高可靠性。在创业建议方面,他主张先用最强前沿模型验证产品,再通过蒸馏 (Distillation) 降低成本。访谈最后探讨了 AI 采用缓慢的深层原因——类比 Palantir 的"前置部署工程师 (Forward Deployed Engineers)",AI 同样需要深入用户场景的软件来连接智能与真实需求,以及他对未来人类角色的乐观展望:未来只有两种工作——"孤独天才"与"管理者"。

正文

从 Palantir 到 OpenAI:研究之路的起点

Bob McGrew 离开 Palantir 时,最初的打算并非加入研究实验室,而是想创办自己的公司。他的核心论点是:深度学习 (Deep Learning) 催生的第一个真正商业领域将是机器人技术 (Robotics)。那是 2015 年,他通过朋友进入了一个非营利机构的实验室,虽然没有工牌,但每天由朋友开门让他进去学习。他通过教机器人从视觉中学习下跳棋来掌握深度学习的基础。

然而,这段经历让他认识到:2015 至 2016 年绝不是创办机器人公司的正确时机。最终他选择加入 OpenAI,原因很简单——那里聚集了大量聪明人,拥有宏大野心,是他真正深入精通深度学习的理想场所。他在 Palantir 积累的管理经验可以在 OpenAI 找到用武之地,而这里也让他得以从专家视角理解深度学习的真正应用前景。

早期项目:魔方机器手与 Dota 2

OpenAI 创立之初的目标始终是构建通用人工智能 (AGI),但早期的理论是通过大量研究和论文来达成。McGrew 坦承,这个理论其实是错误的——对于 Sam Altman、Greg Brockman 和他自己这样的创业型人物来说,这种方式显得痛苦且过于学术化,但在当时,这确实是他们力所能及的。

McGrew 参与的早期项目之一是机器人项目:他们用人形机器手来解魔方 (Rubik's Cube)。其核心思路是:如果将环境设计得足够复杂,人工智能就能从狭窄的训练域中泛化 (Generalize) 出来,学到更复杂的能力。这一理念后来在大型语言模型 (LLM) 中得到了回响。

另一个重大早期项目是攻克 Dota 2。从西洋跳棋 (Checkers) 到围棋 (Go),用游戏推进 AI 发展有着悠久传统。击败围棋之后,下一个最难的挑战就是电子游戏——虽然不太"体面",但 McGrew 确认,从数学角度看,它们的难度确实更高。DeepMind 选择了星际争霸 (Starcraft),OpenAI 则选择了 Dota 2。

Dota 2 项目产生了一个真正的洞见:它极大地强化了团队对"规模化 (Scale) 是提升人工智能的关键路径"的信念。秘密在于,可以将海量经验 (Experience) 输入神经网络,而神经网络能够从中学习并泛化。这一关键思路后来被回应用于机器手项目,也成为了 GPT 系列模型的基石。

GPT 的诞生:Alec Radford 的坚持

在机器人手和 Dota 2 两大项目并行推进的同时,Alec Radford 正在语言领域进行实验。GPT-1 背后的核心思想是:如果使用 Transformer 架构,并应用"猜测下一个词元 (Next Token Prediction)"这个极其简单的目标函数,就能获得足够强的信号,使模型生成连贯的文本。

McGrew 感叹,事后看来这似乎理所当然——"显然这会奏效"——但在当时,没有人相信这能成功。Alec Radford 不得不坚持了数年才让这个想法落地。GPT-1 成功之后,团队将 Dota 2 和机器手项目中的规模化训练经验融入其中——在越来越大的规模上训练,使用极其多样化的数据集,并追求泛化能力——这些要素共同催生了 GPT-2、GPT-3 和 GPT-4。

OpenAI 的文化:介于集中规划与自由放任之间

McGrew 将 OpenAI 的文化与 DeepMind 和 Google Brain 做了鲜明对比。DeepMind 的文化(至少是漫画式的概括)是:Demis Hassabis 有一个宏大计划,雇佣大量研究员来执行他的计划。Google Brain 则是:重建学术生态——招募所有顶尖研究员,不给他们任何方向,只提供大量资源,然后期待惊人的成果自然涌现。Google Brain 确实产出了一些成果,但这些成果未必留在了 Google 内部。

OpenAI 采取了不同的路径——更像一家创业公司。没有集中式的大计划,但也不是简单地"百花齐放"。他们对自己要做的事有明确观点,比如"如何通过规模化来证明你的想法有效"。这种方向性观点由研究领导层(早期主要是 Ilya Sutskever,以及 Dario Amodei 等人)设定,确保资源不是无差别地撒向所有人,也不被单一思路所局限。他们在两者之间找到了一个恰到好处的平衡点。

论文署名与学术信用问题

McGrew 对学术界有一个微妙的看法:他高度尊重学者和研究员,但对学术体制本身持批评态度。学术体制擅长让小团队尝试疯狂想法,但其激励机制严重阻碍了协作,尤其是对"功劳 (Credit)"的执念。

OpenAI 早期做了一个重要决定:在论文署名上尽可能包容,把所有人的名字都放上。更极端的是,他们在一篇早期机器人论文中直接署名为"OpenAI"——因为他们不想陷入第一作者之争。在学术界,第一作者意味着被引用、名字出现在每一处引用中。OpenAI 选择回避这种争夺,仅以机构名义署名。

McGrew 认为这是一个极其重要的文化特征:承认人们渴望获得认可,但将这种渴望引导到内部声望上,而非论文的作者排序。很长一段时间内,OpenAI 内部几乎没有头衔(除了 CEO),但人们总能识别出谁是最优秀的研究员。

规模化定律:从零到一的艰难与从一到 N 的挑战

McGrew 指出,规模化定律 (Scaling Laws) 在 AI 进步中无处不在。关键问题是:既然规模化定律如此普遍,为什么我们没有更早地在其他领域加以利用?

他以 DALL·E 为例说明。Aditya Ramesh 花了 18 个月到两年的时间,才做出第一个明确能工作的版本。McGrew 回忆道,Ilya Sutskever 会给他看 Ramesh 的进展——"Aditya 已经在这上面干了一年,他试图生成一只在冰上滑旱冰的粉色熊猫,因为这是明显不在训练集中的图像"。McGrew 看到图片后,粉色在上面、白色在下面,心想"真的吗?也许吧"。从零到那个"勉强开始工作"的临界点,是一个极其困难的挑战,这与规模化定律完全无关。

一旦突破零到一,规模化定律才发挥作用。此时有两件难事可做:第一是纯粹的规模化本身——规模化绝非易事,它本质上是模型构建中的核心实践难题,涉及系统问题、数据问题和算法问题,即使你只是试图扩展同一架构。第二是试图改变规模化定律的斜率——寻找更好的架构、更好的优化算法,以及所有可能的算法改进。将这两者结合,才能解释当今 AI 领域飞速进步的原因。

数据墙与推理:新的 S 曲线

关于规模化定律是否会持续的争论,McGrew 明确表示:数据墙 (Data Wall) 是真实存在的。如果继续使用与 LLM 规模化相同的技术,终将触及这一瓶颈。

然而令人兴奋的是,从预训练 (Pre-training)——即用越来越大的语料库预测下一个词元——转向推理 (Reasoning) 技术,正开启一条新路径。OpenAI 在 o1 和 o3 模型中推出了推理能力,Gemini 也在 Gemini Flash Thinking 中跟进。

McGrew 用摩尔定律 (Moore's Law) 做了精妙的类比:摩尔定律看似一条大指数曲线,实际上是多条 S 曲线的叠加。先是登纳德缩放定律 (Dennard Scaling),当它到达极限后,NVIDIA 通过不同机制使摩尔定律得以延续。解决一个瓶颈后,某种特定方案呈现 S 曲线饱和,但其他地方还有新的瓶颈需要攻克。

他认为,当前预训练和数据正在触及瓶颈——是否已经精确触达尚难断言——但推理和测试时计算 (Test-Time Compute) 提供了新的机制。回顾过去五年,前沿实验室普遍认为:第一步是预训练,而通向 AGI 的剩余缺口就是推理——让同一个预训练模型有更多时间思考或使用更多计算,从而获得更好的答案。如今这个难题已被攻克,McGrew 认为,我们已有一条非常清晰的路径可以专注于规模化。

五级 AGI 框架与创新者时代

OpenAI 曾提出 AGI 的五个层级。McGrew 认为,事情大体上正在按照 OpenAI 网站上的原始描述发展:推理者 (Reasoners) 已经到来,而创新者 (Innovators) 正成为下一个焦点。以 o3 为例——当 o3 Pro 发布时,那将是一个真正的里程碑,可以将它接入生物实验室,实现对科学领域的自主探索。

但 McGrew 指出了一个有趣的矛盾:我们很可能在模型能够在物理世界中行动之前,就拥有能探索科学假说并设计实验的模型。换言之,模型能够思考实验方案,但还无法亲自执行实验——这意味着我们又回到了机器人领域。自动化科学家 (Scientist) 可能会比自动化实验执行者更早实现。

推理如何解锁智能体

McGrew 认为,推理模型带来的另一个重要影响是解锁了智能体 (Agents) 的潜力。"智能体"这个词可能有些被过度炒作,但从根本上说,推理的核心能力是让模型在长时间内保持连贯的思维链 (Chain of Thought),稳步推进问题解决。让模型"更努力思考"的技术,同样适用于在现实世界和虚拟世界中采取行动。

推理和长时间思考将真正释放智能体代为行动的可能。这在技术上一直可行,但从未足够可靠——你必须愿意等待 5 分钟甚至 5 小时让智能体完成任务,而它最终必须确实能成功。McGrew 认为这一可靠性目标现在已在视野之内。

可靠性的代价:每一个"九"都需要一个数量级

阻碍人们信任智能体执行行动的核心因素是行动的正确率。McGrew 提出了一个实用的经验法则:如果你想增加一个九——从 90% 到 99%,或从 99% 到 99.9%——大约需要一个数量级的计算量增加。历史上,我们只能通过训练更大的模型来实现数量级的计算提升;而现在,推理能力让我们可以通过让模型思考更长时间来达到同样效果。

当然,让模型思考更长时间本身是一个极其困难的问题——o1 和 o3 模型产生的思维链越来越长,需要更多规模化。如前所述,规模化是核心难题,这绝非易事,也远未完成。但现在至少有了一条非常清晰的路径,让我们能够达到越来越高的可靠性水平,而高可靠性将解锁大量下游应用。

蒸馏:大模型到小模型的艺术

过去一年,前沿实验室和其他研究者已经掌握了将大模型蒸馏 (Distillation) 为小模型的技巧:针对特定的用户输入分布,训练一个几乎与大模型一样好、但小得多、快得多的模型。这一趋势将在未来愈发显著——Claude Sonnet 对 Haiku、Gemini 对 Gemini Flash、o1 对 o1 Mini 和 4o Mini,每个实验室都在重点推进这一方向。事实上,"蒸馏即服务"也正在兴起。

给 AI 创业者的建议:先用最强模型,再考虑成本

McGrew 对 AI 创业者的建议非常务实:从你能获得的最好模型开始。你的创业公司之所以能成功,必然是因为利用了 AI 的某种能力,而这种能力实际上需要前沿水平才能实现。所以先用最强模型让产品跑通,然后再通过蒸馏优化——用更小的模型尝试提示工程 (Prompting),或让前沿模型训练更小的模型。

他强调,创业中最宝贵的资源是时间。除非万不得已,不要像 Palantir 那样花三年才将产品推向市场。你应该尽快构建产品,只有通过与用户反复迭代、真正找到价值所在之后,才去考虑成本问题。

电影《Her》与个性化 AI 的现实

当被问及电影《Her》中描绘的深层情感连接是否会成为现实时,McGrew 表示怀疑——他认为男性并不会真正寻求 AI 女友。但他认同某些个性化 AI 场景极具价值:一个了解你偏好并替你购物的 AI,一个了解你工作习惯的办公助手——这些都需要对用户有大量了解。

他还提出了一个有趣的想法:如果每个人的 AI 助手都能代表自己,那么当你想知道某人在想什么时,可以直接询问他们的 AI。如果你的 AI 给出了足够好的回答,你就不必亲自打扰对方。这将是个性化 (Personalization) 的巨大成就。

工作中与你协作的 AI 需要大量关于你的上下文——它应该能读取你的 Slack、Gmail 和所有生产力工具。McGrew 认为这实际上是当前市场的一个真正空白——他今天还无法买到这样的产品。他心中构想的是一种"超级智能精灵",了解你是谁、你在做什么,甚至知道你的职业和人生目标,会主动提醒你应该做什么,甚至替你预约、提醒重要事项。

AI 采用缓慢的深层谜题

McGrew 提出了一个深刻的问题:回到 2018 年人们讨论 GPT-1 的时候,如果你问"AI 是什么",人们会说——能通过图灵测试 (Turing Test) 的模型,能看东西、写代码,甚至能画图。而如今我们拥有所有这些能力已经好几年了,但当时人们预测的结果——"所有笔记本电脑工作者立刻失业,人类游戏结束"——完全没有发生。AI 确实产生了一些影响,尤其是对写代码的人,但从生产力统计数据来看,你很难看到 AI 带来的变化,除非你去衡量我们正在建造的数据中心有多大。

这是一个深层谜题:为什么 AI 的采用速度相对于 2018 年的预期如此之慢?

Palantir 的启示:前置部署工程师模式

McGrew 用 Palantir 的经历类比了当前 AI 面临的问题。Palantir 的核心理念之一是"技术已经存在,只是尚未均匀分布"。Palantir 进入政府部门和三字母机构时,发现那里根本没有软件——这就是 Palantir Government 最早的价值所在。

关键在于重新想象工作方式。例如,检查飞入美国的人是否有犯罪记录,传统方式是在 20 个不同数据库中逐一查找;而更好的方式是一次查询就自动检查所有数据库。AI 同样需要这种范式转变——让人们发现如何用 AI 解决真正的问题,而不只是在现有工作流程上叠加 AI。

这正是 Palantir "前置部署工程师 (Forward Deployed Engineers)" 的价值所在。这些工程师不是坐在总部,而是坐在客户办公室里,亲眼观察客户如何工作,然后为他们打造完美的软件。McGrew 认为这可能是 AI 采用缓慢的答案:我们需要更多像前置部署工程师那样的人,将 AI 的智能与用户的真实需求连接起来。讽刺的是,2015 年人们还质疑 Palantir 为什么需要前置部署工程师——"如果有好产品就不需要定制化"——但五年后 Palantir 成功上市,十年后成为极具价值的公司,现在所有人都在谈论建设自己的前置部署工程团队。

育儿与未来工作:孤独天才与管理者的时代

McGrew 作为家长也面临着深刻困惑。他 8 岁的儿子对编程充满热情,想创办一家做小行星采矿的公司。McGrew 每天用语言模型根据儿子的兴趣生成课程——教他网络、循环等编程概念。他妻子问他:既然语言模型以后都能写代码了,为什么还要教?

McGrew 的回答是:编程是学习批判性思维 (Critical Thinking) 的方式。他引用了 Paul Graham 关于"媒介的抵抗性 (Resistance of the Medium)"的概念——即使计算机能替你编程,亲自动手的经验仍然至关重要,因为只有这样你才能建立关于"什么可行、什么不可行"的直觉。

关于未来人类的工作,McGrew 认为将只有两种角色:一种是"孤独天才"——像 Alec Radford 那样独自在电脑前工作、想出疯狂想法的人,但现在计算机能极大地放大他们的能力;另一种是"管理者"——你将成为自己公司的 CEO,而那家公司主要由 AI 组成(他相信仍会有其他人类参与,但公司的大部分成员将是 AI)。

他用摄影术的发明做类比:当照相机和胶片出现时,艺术家并没有消亡。如今学习绘画的人反而更多,因为更多人对艺术和视觉艺术有了欣赏能力。同样,回顾 1880 年代,大多数美国人都是农民,而今天只有约 3% 的美国人是农民,但所有人都有工作。如果向 1880 年代的人解释"软件工程师"或"创业孵化器运营者"是什么样的工作,他们会觉得"这算什么工作"。McGrew 对人类持乐观态度:人类仍将扮演重要而有价值的角色,只是我们还不清楚孙辈的工作会是什么样子——我们需要像过去的农民一样,在变化中摸索前行。

机器人技术的 ChatGPT 时刻

回到机器人话题,McGrew 判断:目前的机器人公司,正相当于五年前的 LLM 公司。在未来五年内,甚至在五年中的某个时刻,我们将看到机器人领域的 ChatGPT 时刻。虽然机器人比纯软件更难规模化——因为需要制造物理机器人——但像 Skilled AI 和 Physical Intelligence 这样的公司正在构建机器人的基础模型 (Foundation Models),他们展现的进步令人惊叹。

总有一天,机器人技术会走出"零到一"的阶段——从"勉强能工作"进入"基本可用",然后通过规模化来提升可靠性和市场范围。

自动化科学家与科学进步的瓶颈

McGrew 提出了一个看似矛盾却很可能成为现实的判断:我们可能会在自动化科学家和发明者之后,才自动化实验执行者。这意味着 AI 能设计实验方案,但执行实验仍需人类或物理机器人。然而一旦机器人技术跟上,科学快速进步的潜力将完全释放。

但他也预见了新的瓶颈:我们回顾这段对话时可能会发现,即使做到了所有这些,科学进步的速度可能只提高了 30%,而不是 300 倍。我们将不得不找出新的瓶颈所在——不过,30% 的加速本身已经是一个好问题了。