把 AI 数据中心送入太空:StarCloud 的疯狂野心与历史性第一步

摘要
2024 年 11 月 2 日,一枚 SpaceX 猎鹰 9 号火箭搭载 Bandwagon-4 拼车任务升空,载荷中包含一颗代号为 StarCloud 1 的小型卫星——它的内部搭载了一枚 Nvidia H100 GPU,这是人类历史上首次将数据中心级别的地面 GPU 送入太空轨道运行。StarCloud 是一家由 Philip Johnston 联合创立的初创公司,其愿景堪称宏大至极:在太空建造大规模轨道数据中心(Orbital Data Centers),利用不间断的太阳光照供电、以深空的真空环境作为散热媒介,实现零淡水消耗、低碳排放的 AI 算力基础设施。在太阳同步轨道(Sun-Synchronous Orbit)上,这些数据中心将摆脱土地、电网和冷却的地球物理约束,几乎可以无限扩展,最终目标是建造 40 兆瓦、重达百吨的轨道 GPU 集群——恰好可以装入一艘 SpaceX 星舰(Starship)的载荷舱。公司从创立到卫星入轨仅用了 15 个月,打破了此前初创公司 4 年的最快纪录。本文深入探访了 StarCloud 位于华盛顿州雷德蒙德的总部,还原了这支由互补背景组成的团队如何在质疑声中快速推进,以及他们面临的散热、辐射屏蔽等核心工程挑战。与此同时,Google、SpaceX、Amazon 等巨头也已开始将目光投向太空数据中心——一个全新的产业或许正在诞生。
第一章:太空数据中心的诞生——StarCloud 1 升空
这一刻,或许标志着一个全新产业的起点。"StarCloud 1,分离确认。"当卫星成功与火箭分离的信号传来,人类在太空运行数据中心级算力的序幕正式拉开。数据中心占据大量物理空间,消耗巨额能源,这已成为地球上的严峻瓶颈。StarCloud 的出现,正是为了回应这一挑战。他们的愿景是:未来大多数新建数据中心将部署在太空,而非地球表面。虽然目前起步规模不大,但最终目标是建造庞大的轨道数据中心,使计算更加高效,减轻地球有限资源的负担。Philip Johnston 坦言:"我理解为什么有人觉得这是天方夜谭,但对我来说,做这件事的理由在于潜在影响绝对巨大——即使你认为成功的概率很小,也值得承担这样的风险。"
第二章:StarCloud 的核心愿景——轨道 GPU 集群
Philip Johnston 和他的团队最近创造了航天历史:他们将一颗搭载 Nvidia H100 GPU 的卫星送入轨道。"这是人类首次尝试将数据中心级别的地面 GPU 送入太空,这将是众多类似任务中的第一次。"虽然目前本质上是一台原型机,但它的算力仍然是太空真空中有史以来运行过的最强计算机的 100 倍。
StarCloud 的目标是建造全球首个轨道数据中心——大规模 GPU 集群由不间断的太阳能驱动,在太空运行 AI 算力。在太阳同步轨道(Sun-Synchronous Orbit)上,这些数据中心将获得不间断的阳光照射以供能,将废热以红外辐射(Infrared Radiation)方式散发至深空,运行过程零淡水消耗,碳排放也远低于地球上的数据中心。通过将"云"搬离地球,StarCloud 可以几乎无限地扩展,不再受制于土地、电网和冷却的限制,最终目标是与地球上最大规模数据中心的成本竞争。
第三章:为什么是太空?——能源危机与数据中心之困
为什么要把数据中心建在太空?这似乎是个违背直觉的问题——毕竟地球上建造数据中心已经够困难了。Philip 的回答直指核心:我们正看到对数据中心能源需求的"绝对海啸"般增长,同时社会整体电气化趋势也在加速。然而在西方世界,大规模基础设施项目的建设效率并不理想。
StarCloud 的愿景是逐步发射越来越大的卫星,验证这一概念的可行性,在太空中部署高算力设备来服务客户。如果成功,它将对世界、对 AI 的发展、对 AI 训练和使用的方式产生巨大影响。地球上的数据中心冷却方式本质上是蒸发大量淡水,这已在美国部分地区造成了严重问题——河流和湖泊正在被抽干以维持数据中心的冷却。而 StarCloud 的太空数据中心完全不需要淡水——散热方式从蒸发冷却变为向深空辐射红外热量。他们建造了大型散热器(Radiators),内部循环流体但不外排,将热量消散到太空真空中。
第四章:团队——三位互补的联合创始人
StarCloud 的三位联合创始人拥有极为互补的背景,堪称这一领域创业的完美组合。
Philip Johnston 本人并非航天工程出身。他职业生涯的前 5 年从事软件工程,本科和硕士则攻读应用数学与理论物理。他自幼对太空充满热情,但真正让他意识到机遇所在的是发射成本的快速下降——这在很大程度上归功于 SpaceX 以及 Stoke Space 等正在研发可重复使用火箭的初创公司。由于火箭可以每日复飞且大批量生产,发射能力可能提升 100 甚至 1000 倍,这将催生大量全新的商业应用场景。
联合创始人 Addi 在 Microsoft 有 20 年数据中心建设经验,之后在 SpaceX 担任首席软件工程师,负责软件层面的全部工作以及计算模块(Compute Module)的集成,确保芯片在高辐射(High Radiation)环境中正常运转。
CTO Ezra 拥有工程学博士学位,在设计卫星方面有十年经验,曾参与 NASA 的月球探路者(Lunar Pathfinder)任务,负责可展开太阳能板的设计。他负责卫星结构的全部工程。三位创始人的分工覆盖了商业计算载荷和卫星结构两大核心领域,团队配合极为默契。
第五章:从太空太阳能到太空数据中心的战略转型
StarCloud 的商业构想经历了一次关键转型。最初团队研究的是天基太阳能(Space-Based Solar)——即在太空部署超大型太阳能板,将电力传输回地球。然而他们发现,这一模式在商业上需要发射成本降至每公斤约 50 美元才能盈亏平衡,而当前水平相距甚远。更关键的问题是:天基太阳能从太空向地球传输电力的过程中会损失 95% 的能量。
那么,如果不把电力送回地球,而是把数据中心送上去呢?团队重新计算后发现,太空数据中心模式的盈亏平衡发射成本约为每公斤 500 美元——这个数字远比 50 美元更接近当前实际水平。这一发现成为了一篇白皮书的理论基础,也标志着 StarCloud 商业方向的正式确立。
第六章:YC 孵化——从羞于启齿到拥抱宏大愿景
2024 年夏天,Philip 和联合创始人们带着这个想法参加了 Y Combinator 的面试——这是他们第三次申请,终于入选。当时的公司名称还是 Lumen Orbit。
在 YC 批次期间,他们最初只申请了业务的第一部分——为其他卫星提供云服务。团队在面试时曾提到背后还有一个更大的商业模式——为几乎所有数据中心提供能源,但他们当时有些"不好意思"谈论如此宏大的愿景。YC 的反馈是鼓励他们大胆追求。Philip 坦言,当你告诉别人 10 年内大多数新建数据中心可能建在太空时,很多人会觉得荒谬——但 YC 不会。YC 的文化恰恰鼓励创始人拥抱看似疯狂的宏大愿景,这正是 StarCloud 需要的外部推力。
第七章:15 个月的奇迹——从创立到卫星入轨
团队参观了 StarCloud 位于华盛顿州雷德蒙德(Redmond, Washington)的总部。设施分为多个功能区:总装车间用于展开和迭代可展开结构原型;电气与软件工程团队在一个区域办公;机械工程师在后方工作;洁净区用于精密装配;而"脏区"则负责铝制零部件的加工制造。
团队在内部完成了全部载荷(Payload)、电力系统以及散热系统的建造。振动测试台(Vibration Table)用于对电气硬件进行振动测试——模拟卫星在各个轴向、不同频率和振幅下的振动环境,确保硬件能够承受发射和轨道运行的严苛条件。
此前的纪录是初创公司从创立到卫星入轨耗时 4 年。StarCloud 仅用 15 个月就完成了卫星的设计、建造、测试和交付。Philip 将此归功于联合创始人团队——计算模块、天线等所有部件均在内部手工建造,团队成员彻夜赶工直至载荷发货的那一天。第一颗卫星重约 60 公斤,体积相当于一台小冰箱,搭载来自 Nvidia 的 H100 GPU 以及多种测试天线。卫星平台(Bus)则由 Astro Digital 公司承包建造。
第八章:历史性发射——StarCloud 1 进入轨道
2024 年 11 月 2 日,一切准备就绪。SpaceX 的 Bandwagon-4 拼车任务(Rideshare Mission)搭载 StarCloud 1 升空,载荷中包含全球首枚部署在太空的 Nvidia H100 GPU。"发射主管,准许发射。3、2、1,引擎点火,升空!"随着倒计时结束,StarCloud 1 踏上了它的轨道之旅,所有系统正常运行。
第九章:在轨测试——太空中的 AI 首秀
卫星入轨后的数月内,StarCloud 将执行一系列密集的测试任务:在太空中训练首个模型、运行高功率推理(Inference)、在轨道上运行 Google Gemini 的一个版本——这些都将是人类航天史和 AI 发展史上的首次。这些测试旨在验证核心工程假设:他们的热管理(Thermal Management)和辐射屏蔽(Radiation Shielding)技术是否能够支持最先进的芯片在太空环境中稳定运行。
第十章:回应质疑——散热并非不可能
太空数据中心的构想并未说服所有人,这一概念在网络上引发了大量质疑和激烈辩论。Philip 被要求回应 Andrew McCallip 的一篇质疑热帖。批评者的核心论点是:在太空中散热需要极大的表面积,因此被认为极不现实。
Philip 的回应直接而有力:他的联合创始人 Ezra 拥有工程学博士学位,花了 10 年设计和建造大型可展开结构(Deployable Structures)、太阳能板和散热器。解决方案就是建造大面积——而这正是他们在做的。公司工程团队的一半人力专门投入于开发一种低成本、低质量的大型可展开散热器(Deployable Radiator),这正是 StarCloud 的核心知识产权(Core IP)。Philip 坦言,这种质疑反而成为了 100% 的驱动力。
他进一步引用了 Sam Altman 约 8、9 年前一次演讲中的观点:"建立一个困难的公司比建立一个容易的公司更容易。"如果 StarCloud 能解决唯一的那件难事——在太空廉价地运营数据中心——那么其他一切都变得更容易:招聘顶尖人才更容易,获得媒体关注更容易,甚至融资也更容易。这是一个反直觉但深刻的事实。
第十一章:第二步——更强大的第二颗卫星
StarCloud 的第二颗卫星计划于 2025 年 10 月发射,算力将至少是第一颗的 10 倍。它将搭载 Nvidia 的 Blackwell 架构 GPU,配备更多 GPU,并通过光学终端(Optical Terminals)实现极高带宽的通信连接,提供全天候 24/7 的高带宽、低延迟连接——这是一个巨大的差异化优势。
第十二章:产业浪潮——巨头入场
距离 StarCloud 宏大愿景中 5 吉瓦(GW)规模的轨道数据中心可能还有十多年之遥,但他们已经迈出了关键的第一步。而且他们不再是孤军奋战——Google、SpaceX、Amazon 等科技巨头都已在探索轨道数据中心的可行性,这些设施将由太阳光供能、以太空真空冷却。一个全新的产业或许正在形成。
Philip 最后说道:"任何值得做的事都必然困难。如果一件事太容易,它可能就不会有同样的潜在回报。所以我们决定去做最大、最雄心勃勃的事——那就是在太空建造几乎所有数据中心。"