马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧
摘要
埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群
埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“世界上最强大的 AI 训练集群”。

如此庞大的算力规模,背后是惊人的电力需求。简单算一笔账:单块 H100 GPU 的功耗至少是 700 瓦,这意味着整个数据中心满载运行时,仅仅是 GPU 部分就需要超过 70 兆瓦的电力。这还没算上服务器、网络和冷却系统那些“耗电大户”。更令人意外的是,由于和当地电网的供电协议还没最终敲定,这个庞然大物目前竟然是靠着 14 台大型移动发电机在维持运转。
电力困局与临时方案
这事儿其实早有端倪。AI 和半导体分析师 Dylan Patel 之前就在社交媒体上指出,受制于电力供应,马斯克的这个超级集群很可能开动不起来。他观察到,现场从电网实际获取的电力只有 7 兆瓦左右,仅够支撑大约 4000 块 GPU 运行。根据计划,田纳西河谷管理局(TVA)倒是承诺在 8 月 1 日前提供 50 兆瓦电力,前提是 xAI 能签下协议。另外,场地上那个关键的 150 兆瓦变电站还在建设中,预计要到今年第四季度才能完工。
那么问题来了,马斯克怎么解决眼前的电荒?Patel 很快通过卫星图像找到了答案——14 台 VoltaGrid 移动发电机被部署在现场,连接着看起来像四个移动变电站的设备。

这种半挂车大小的发电机,每台能提供 2.5 兆瓦电力。14 台全力开动,就是 35 兆瓦。再加上从电网获取的约 8 兆瓦,总电力供应达到了 43 兆瓦。这笔“临时电”足以让大约 3.2 万个 H100 GPU 以有限功率运行起来。
如果田纳西河谷管理局那 50 兆瓦电力能在 8 月初顺利接入,那么同时运行 6.4 万个 GPU 将不成问题。但 Patel 也测算过,要想让 10 万个 GPU 全部满血工作,总共需要 155 兆瓦的电力。要达到这个目标,要么等待变电站提前竣工,要么就只能继续加码,部署更多的移动发电机来填上电力缺口。
难以忽视的环保代价
巨大的电力消耗及其对气候的影响,已经是当前所有 AI 数据中心头顶的“达摩克利斯之剑”。有个数据听起来挺震撼:2023 年全球售出的所有数据中心 GPU,其总耗电量已经超过了 130 万个普通美国家庭的用电量总和,给各地的电网带来了前所未有的压力。而且,电力危机不是多建几个发电厂就能解决的,配套的高压输电线路、变电站等基础设施的建设同样耗时耗力。
除了时间和经济成本,温室气体排放是另一个必须直视的问题。尽管马斯克在孟菲斯使用的移动发电机以天然气为燃料,相比煤炭或石油确实更清洁一些,但运行过程中无可避免地会向大气排放二氧化碳。
谷歌最近的报告就很有代表性,由于其数据中心能源需求暴涨,公司自 2019 年以来的碳足迹增长了 48%。可以预见,除非 xAI 转向更清洁的能源获取方式,否则很可能面临类似的环保问责。
眼下,马斯克正不惜一切代价推动 xAI 在 AI 竞赛中抢占领先地位。使用移动发电机只能是权宜之计。孟菲斯超级计算集群的未来,必然需要过渡到更可持续的能源方案。田纳西河谷管理局的电力组合——包括核能、水电和部分化石燃料——如果能够成功接入,其碳足迹将远小于完全依赖天然气发电机。这条路,才是真正兼顾了算力冲刺与环境责任的长期解法。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。