马斯克最大算力中心建成了:全球首个GW级超算集群,再创世界纪录
Colossus 2正式投运
Jay 发自 凹非寺量子位 | 公众号 QbitAI
刚刚,全球首个GW级超算集群Colossus 2,正式投入运行。
马斯克兴奋喊话:
这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。

网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」

有了这剂算力强心针,Grok的忠实拥趸已经提前开香槟,开始畅想Grok5的统治时代。

但在全网狂欢的背后,更多的人是苦不堪言——
2026年夏天,美国13个州的6700万居民,可能要因数据中心的存在被停电,没空调吹了。
全球首个GW级训练集群
老马的执行力太恐怖了。
不靠亚马逊,不靠微软,也没有「星际之门」计划,一己之力于孟菲斯平地建起一座1GW的超级超算集群。
前一代超算集群Colossus 1从无到有仅用了122天。
它配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。
而在此基础上翻了好几倍,功率达到1GW的Colossus 2,只花了仅仅不到一年。
1GW是什么概念?
一般来说,1GW可以为75万户家庭供电,轻松供电一整个旧金山。
一座核电站的功率差不多也就是1GW。
如果按马斯克所说,今年4月份,Colossus 2将升级至1.5GW,最终总装机容量达到2GW,这个数字将与美国大多数主要城市的用电量相当。
按照规划,彻底完工后的Colossus 2将内置55张GPU,远超Meta的15万、微软10万,以及谷歌的分布式基础设施。
而这庞大的资源,全部为Grok独自享用。
此前,曾有爆料称Grok 5的参数将达到惊人的6万亿左右,是Grok 4的两倍以上。
原因便是基于Colossus 2:
当时有观点认为Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。

如今,Colossus 2已正式上线,1GW的条件也正正好好满足。
而随着前段时间xAI E轮融资200亿美元的进账,Grok 5的Scaling筹码还在进一步增加。这意味着更大的模型参数,更快的训练速度、迭代速度,部署速度。
当OpenAI还在为2027年的算力基础设施发愁时,xAI已经把一座「城市级」AI 工厂开机运行,将Grok 5提前扶上了市场心目中的下一个SOTA。
正如网友所说,AI时代,速度就是最强的护城河。

居民受不了啦!
不过,并非所有人都因这种「速度」受益。
据《华尔街日报》消息,美国非营利电网运营商PJM,未来可能在极端高温或严寒天气期间,轮流对区域内的居民断电。
这意味着,美国13个州的6700万人,在今年不得不迎来一个相当难熬的夏天。
要说清楚这个问题,得先明白PJM是干嘛的。
PJM,简单来说就是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持供需平衡。
然而,大模型大力出奇迹的竞赛正在破坏这种平衡。
在数据中心建设热潮推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。
对一个多年需求变化不大的系统来说,这样的增速相当罕见。
一边需求激增,另一边,供给的增速却相当缓慢。新建电厂的速度甚至都跟不上老电厂的退役速度,电网容量面临饱和。
供需一旦出现偏差,电网频率就会波动,进而可能损坏发电厂等关键基础设施。
为避免这些风险,PJM只能两害相权取其轻,通过在用电高峰期轮流停电来卸压。
PJM也不是没想过其他办法。
去年9月,PJM发布了一系列提议,希望数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。
然而,亚马逊、谷歌、微软等几乎都表示了反对,认为这是对数据中心的歧视。
值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus位于中南部,并不在PJM电网覆盖范围内。
同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。
参考链接:
[1]https://x.com/MilkRoadAI/status/2012558197240815665
[2]https://www.wsj.com/business/energy-oil/power-grid-ai-data-centers-1235f296
- DeepSeek母公司去年进账50亿,够烧2380个R12026-01-13
- 姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲!基模四杰中关村论英雄2026-01-11
- 和闫俊杰一起敲钟的她:31岁,身价48亿2026-01-12
- 清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开2026-01-08




