萨提亚·纳德拉:微软的AI押注、超大规模扩展与量子计算突破

摘要
在这场与Y Combinator的深度对话中,微软董事长兼CEO萨提亚·纳德拉(Satya Nadella)全面阐述了微软在AI时代的战略布局、技术哲学与未来愿景。他将AI定位为继客户端-服务器、互联网与云之后的第四次平台革命,强调平台之间的复合效应——云基础设施为AI超级计算机铺路,后者催生模型,模型又孕育产品。纳德拉反对将AI拟人化,坚持AI是工具而非拟人智能,人类能动性(Human Agency)始终不可替代。他深入讨论了模型与产品之间的边界问题,将当前的大语言模型类比为SQL——正如SQL之上需要应用层一样,模型也需要脚手架层(Scaffolding Layer)、工具调用(Tool Calling)、记忆系统(Memory)与权限体系(Entitlements)才能构建真正可用的应用。在AI扩展定律方面,他指出预训练(Pre-training)与后训练(Post-training)已验证有效,推理时计算(Inference Time Compute/ Test Time Compute)开辟了新的扩展维度,而端到端训练循环(End-to-End Training Loop)可能是下一个重大突破。他警告AI行业必须创造真正的社会盈余(Social Surplus)才能获得消耗能源的社会许可,否则一切不过是估值泡沫。此外,他分享了从工程师到CEO的职场心得,阐述了对人才的三项核心评判标准——带来清晰度、创造能量、解决超约束问题,并展望了微软在量子计算领域基于马约拉纳粒子(Majorana Particle)的突破性进展及其与AI的协同前景。
正文
AI作为第四次平台革命
纳德拉开篇即指出,微软本质上是一家平台公司、产品公司与合作伙伴公司。在他35年的职业生涯中,他亲历了客户端-服务器(Client-Server)、互联网、移动与云四次重大平台变迁,而AI正是最新的一次。他强调这些平台之间存在强大的复合效应(Compounding Effect):云基础设施的成熟使得AI超级计算机的构建成为可能,AI超级计算机催生了大模型,大模型又孕育了终端产品。这种层层递进的关系使得AI技术的扩散速度前所未有地快、覆盖面前所未有地广——因为它建立在上一代平台的基础之上。
他特别指出,大规模训练任务与云时代的工作负载截然不同——它是一种数据并行的同步工作负载(Data Parallel Synchronous Workload),与Hadoop等传统分布式任务有本质差异。因此,每一次平台变迁都会彻底重塑基础设施层,这也意味着系统软件正处于一个黄金时代,无论对于超大规模云服务商还是基础设施层的创业公司而言,都蕴藏着巨大的机会。
模型与产品:SQL类比与脚手架层
纳德拉提出了一个深刻的类比:当前的AI模型之于应用开发者,犹如SQL之于数据库应用。正如SQL本身不是完整的应用——你需要在SQL之上构建业务逻辑与应用层——同样,仅有模型加一些脚手架和工具调用的无限循环也不足以构成真正的产品。他长期以来一直梦想AI/机器学习能拥有一个类似SQL的"稳定平台层"时刻,而当前的大模型层恰恰提供了这样的基础——一个可以用来构建复杂产品的稳定引擎。
他指出,推理时计算(Inference Time Compute)加上工具调用为构建复杂产品提供了相当稳健的框架。但模型本身与真正影响用户的数据之间存在巨大鸿沟,而产品内部的数据反馈环路——将用户行为数据回传用于后训练(Post-training)与工具选择优化——正是产品创造的核心战场。
纳德拉进一步阐述了脚手架层需要解决的三大核心问题:记忆(Memory)——模型需要持久化的上下文;工具使用(Tool Use)——模型需要调用外部工具的能力;权限(Entitlements)——模型行动时需要明确的授权边界。这三者必须作为模型的一等公民系统来构建,才能支撑更复杂的应用。当这三者就绪后,你就能创建真正的代理(Agent)——它拥有身份标识、管理机制与权限控制。
能源、社会许可与真正的经济盈余
纳德拉提出了一个严肃的宏观视角:当前美国计算所消耗的能源约占全国能源的2%-3%,即便翻倍到6%也是巨大的增量。他强调,历史教会我们的一个关键教训是——如果你要消耗能源,就必须获得社会许可(Social Permission)。这意味着AI的产出必须具有社会价值。如果不能真正创造社会盈余、经济盈余——以国家、社区和行业来衡量——那么我们就无法合理地消耗这些能源。
因此,他并不担心能源生产本身,而更关注未来五年内能否产出足够多的、创造巨大价值的产品。他对AI在医疗、教育与生产力领域的潜力充满信心,但认为科技行业面临的真正挑战是毫无争议地证明AI的成果正在体现在真实的经济统计数据中,而不仅仅是AI基准测试的分数。
他举了一个极其具体的例子:美国医疗支出占GDP的18%-19%,但其中大量成本并非来自药物研发,而是来自工作流程(Workflow)中的文书负担。仅凭一个LLM加一个提示词来处理电子病历系统(EMR, Electronic Medical Record)的出院流程,就能节省大量时间、金钱和精力。每一美元花在文书工作上的钱本可以用于拯救生命的治疗,每一位医生从文书工作转向病人的时间都是可以被释放的。
工作流程的变革与变更管理
纳德拉用一段生动的历史类比说明了工作流程变革的必要性:在PC和电子邮件普及之前,跨国公司做销售预测需要发传真,然后整理内部备忘录、标注数据,希望能在季度末前完成预测。而PC和Excel的出现改变了工作产物(Work Artifact)和工作流程(Workflow),这才是关键所在。
他认为,AI时代同样需要这种根本性的工作流程变革。当有人说"我要用99个AI代理来帮我做事"时,工作流程不会保持不变,甚至工作本身的范围都会改变。因此,变更管理(Change Management)才是AI部署真正的速率限制因素——远比技术本身的部署更难。他举了LinkedIn的例子:他们将设计、前端工程和产品等多个职能合并,创造了"全栈构建者"(Full Stack Builder)这一新角色,这本身就是工作范围的重定义。
他还呼应了Y Combinator对创业者的建议——"去卧底"(Go Undercover):让顶尖的AI研究者去做一段时间的医疗账单员,亲身体验那些所谓的"知识工作"中有多少实际上只是在浏览器、电子表格和邮件之间复制粘贴。这些工作并不需要调动前额叶皮层(Prefrontal Cortex)的高级认知能力,而AI恰恰可以将人从这种繁重的机械劳动中解放出来,让人与AI推理模型在前额叶层面协同工作,而将琐碎任务交给代理处理。
AI发展中的突破与前瞻
纳德拉分享了他对AI技术前沿的观察与预判。他坦承,即便是一年前他也没有预见到强化学习(RL, Reinforcement Learning)与测试时计算(Test Time Compute)能取得如此巨大的进展,且这一方向似乎仍有几乎无限的空间。
他梳理了当前的三大技术层次:预训练已证明有效,后训练技术在此基础上带来了显著提升,推理时计算则在新的扩展定律下开辟了巨大空间。他接下来关注的两个方向是:算法层面的新突破——当前的技术范式可能被某个更高效的算法完全颠覆,他始终保持开放心态;以及端到端训练循环——从预训练到强化学习的完整集成循环,这可能是下一个重大突破,预计在未来一年内将成为各实验室的重点方向。
关于LLM是否具有"意识"的讨论,纳德拉明确表达了自己的立场:"人工智能"(Artificial Intelligence)可能是有史以来选得最糟糕的名字。他反对将AI拟人化,认为AI是一种工具,它确实展现出了智能的迹象,但那不是人类拥有的智能。人类能动性仍然重要,我们仍然会把这些当作工具来使用。
软件工程的未来:从编码者到架构师
关于AI对软件工程的影响,纳德拉提出了一个富有洞察力的思想实验:如果有一个火星智慧在1980年代观察人类工作,会看到办公室里有打字员池、幻灯片池,人们用纸工作;如果今天再来看,会发现"八十亿人现在都是打字员了"——因为人人都在键盘上输入。他认为,未来我们所有人都将创造软件,但"软件工程师"这个职业依然存在,只是性质将发生根本变化:软件工程师将变成软件架构师。
他以自己的体验为例:Vibe Coding(氛围编程)非常好用,直到它做了你完全不知道怎么回事的事情——这意味着你必须对代码仓库拥有元模型(Meta Model),必须仔细审视变更日志。他最喜欢的GitHub功能是查看所有代理在其代码仓库上的完整变更日志,就像一个优秀的开发经理确保构建不崩溃、代码质量过硬一样。此外,他还指出了一个常被忽视的现实:在现行法律框架下,法律责任仍然归属于人类与人类构建的机构——这意味着在法律发生根本性变革之前,人类必须在回路中(Human in the Loop),而这也意味着需要大量工具来帮助人类理解AI在做什么。
关于即时生成软件是否会取代打包软件的问题,纳德拉认为两者将共存。他以VS Code和Excel为例:VS Code被大量分叉恰恰说明微软做对了什么,而Excel本质上就是一个IDE——一个出色的画布,你可以将最优秀的分析师模型引入这个画布,在画布与模型之间创建反馈循环。同样,你可以即时生成应用,也可以拥有预制应用来帮助优化与模型之间的反馈循环,这两种模式将长期并存。
Copilot:新浏览器时刻与计算机使用的未来
纳德拉分享了Copilot在Windows上的发展带来的激动人心的变化。他提到微软研究院的第一个研究小组就是1995年由比尔·盖茨创建的语音研究组,自此以来他们一直在梦想语音能成为PC的一等公民。而如今,Copilot带来了两个令他感到超现实的体验:视觉与语音——他始终开着Copilot,它能看见他看到的,他能对它说话,这对他而言就像一次精准的鼠标操作革命。他将其比作"新浏览器时刻",即使是在现有的键鼠形态因素下,计算机使用方式也将发生根本性变革,而新的硬件形态也将随之出现。
关于"计算机使用"(Computer Use),他认为这是所有个人数据、工作数据与Office文档的超级集合——当智能体能够替你操作电脑时,一切数据都触手可及。他引用电影《她》(Her)的类比,认为代理成为你的计算机、替你完成操作正是发展方向,而其中最关键的问题是信任——你能否信任它来精确执行你的意图,这涉及精度、隐私等多重考量。
在隐私与安全层面,他阐述了三个层次:隐私(Privacy)——每个用户都关心;安全(Security)——每个租户与客户在隐私之上额外关心;主权(Sovereignty)——每个国家在安全与隐私之上还关心数据主权。构建任何产品或系统,都必须同时回答用户、组织和国家在这三个层面的问题。
印度农民与世界银行:AI真正价值的故事
纳德拉讲述了一个令他深受触动的案例:2023年初他在印度时,看到一位本地开发者将GPT-3.5与印度技术栈的语音转文字、文字转语音等开源工具串联起来,构建了一个运行在WhatsApp上的聊天机器人,使一位印度农民能够通过政府网站获取农业补贴。这件事让他震撼——西海岸研发的技术以如此快的速度扩散,真正解决了一个实际的使用场景。
他认为这才是需要被大规模讲述的故事,而这恰恰是当前被低估的叙事。过度炒作的是模型能力本身——模型能力确实令人惊叹,但如果不能让全世界认识到AI正在真正改善各地人们的生活,那一切都只是行业估值,终将不会有好的结局。
他还分享了世界银行在尼日利亚和拉丁美洲进行的一项研究结论:获得类似Copilot的工具可能是非洲和拉丁美洲最好的技术教育干预手段。这是科技界数十年来的梦想,如今已触手可及。
从工程师到CEO:职场心得与人才评判
纳德拉分享了他从1992年加入微软至今的职业心得。他强调,不要等待下一次晋升才去做最好的工作——他加入微软时的第一份工作就觉得是最好的工作,如果他退休在那个岗位上也会心满意足。这种心态让他不是在等待下一个机会,而是将当前的机会发挥到极致。
关于人才评判,他分享了三个核心标准,其中第一个来自比尔·盖茨的启发:好的架构师带来清晰度,差的架构师带来混乱——即便他们同样聪明。因此,他始终寻找能够在模糊不确定的处境中带来清晰度的人;第二个标准是创造能量——不仅是自己有能量,更能将多方参与者凝聚在一起,任何说"我的团队很棒,其他人都很差"的领导者在他看来都不合格;第三个标准是解决超约束问题——他最喜欢的面试问题是让候选人描述一个他们曾参与的、似乎走投无路却找到了出路的项目,因为成功者就是能够将超约束问题转化为可解问题的人。这三者——带来清晰度、创造能量、解决超约束问题——构成了领导力的核心,而领导力不是后来才需要的东西,而是每一步都必须践行的品质。
量子计算:马约拉纳突破与AI的协同
纳德拉简要介绍了微软在量子计算领域的重大突破。微软在量子计算上投入了超过20年,历经三位CEO持续投资,目标始终是构建一台容错量子计算机(Fault-Tolerant Quantum Computer),而这需要解决稳定量子比特(Stable Qubit)与纠错量子比特(Error-Corrected Qubit)的根本性难题。
微软押注了一种由意大利物理学家马约拉纳(Majorana)设想的物理特性——最终他们在物理层面取得了突破,成功制备了这一粒子,并由此诞生了Majorana 1芯片。这一突破意味着构建容错量子计算机所需的一个关键前提已经实现。
他将量子计算与AI的关系阐述为:如果要理解自然的语言——即模拟(Simulation)——量子计算机是最好的工具,因为物理与自然本质上是量子的;而AI则是那个模拟器的仿真器(Emulator)。当前,高性能计算(HPC, High-Performance Computing)加AI已经在化学、物理和材料科学领域带来了可观的进展,而量子将是下一步。他对AI加量子与HPC形成闭环所能带来的突破充满期待。
如果重新开始:赋能工具的永恒使命
在被问及如果22岁重新开始会做什么时,纳德拉回顾了Office的诞生故事——文字处理器、电子表格与演示工具——这些工具赋予人们的力量感是无与伦比的。他最喜欢的两个微软产品是VS Code和Excel,因为使用它们时你能感受到那种强烈的赋能感:Excel让你拥有数字直觉与分析力量,仅仅行和列加上中间的调优引擎就是一项突破性发明。
因此,他会选择创造下一代的赋能工具——如今Copilot所代表的研究者、分析师、创造者角色,正如当年的Word、Excel和PowerPoint一样,是他每天都会使用的工具。什么工具能赋予人们那种力量感,他就想做什么——而他有预感,制造这些工具的人此刻就坐在台下的观众席中。