OpenAI的基建豪赌:六座巨型数据中心背后的AI军备竞赛

1

超级基建计划:10吉瓦背后的雄心

OpenAI、Oracle和软银近日联合宣布了一项震撼业界的计划:在美国建设五座新的AI数据中心,将其Stargate AI基础设施平台的总规划容量提升至近7吉瓦,未来三年内的投资将超过4000亿美元。这一庞大的基建扩张旨在应对ChatGPT每周7亿活跃用户的需求,并为未来AI模型的训练提供支持。

尽管有批评人士质疑这种投资结构能否持续,但这三家公司表示,此次扩张使他们有望在2025年底前实现1月份宣布的5000亿美元、10吉瓦承诺的全部目标。

新站点包括三个通过OpenAI和Oracle合作伙伴关系开发的地点:德克萨斯州的谢尔克福德县、新墨西哥州的唐阿纳县以及一个未公开的中西部地点。这些站点加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建,可提供超过5.5吉瓦的容量,意味着现场计算机在满负荷运行时最多可消耗55亿瓦电力。这些站点预计将创造超过25,000个现场就业岗位。

另外两个站点将由软银与OpenAI的合作伙伴关系开发。俄亥俄州洛兹敦的一个站点已经动工,有望在明年投入运营。德克萨斯州米拉姆县的第二个站点将与软银集团旗下的SB Energy共同开发。这两个站点在未来18个月内可能扩展至1.5吉瓦。

六大站点布局:全美AI基础设施网络

这些新站点将与德克萨斯州阿比林的旗舰Stargate校园合并,形成全美AI基础设施网络。目前宣布的Stargate站点包括:

  • 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
  • 谢尔克福德县,德克萨斯州:新Oracle开发站点
  • 唐阿纳县,新墨西哥州:新Oracle开发站点
  • 中西部地点(未公开):新Oracle开发站点
  • 洛兹敦,俄亥俄州:新软银开发站点,明年运营
  • 米拉姆县,德克萨斯州:新软银/SB能源站点

Stargate I site in Abilene, Texas

OpenAI与Oracle在7月份达成的协议,计划开发额外4.5吉瓦的Stargate容量,代表了这两家公司五年内价值超过3000亿美元的合作伙伴关系。这些公司表示,他们在1月启动的全美流程中审查了来自30多个州的300多个提案后,选择了这五个新站点。

算力饥渴:OpenAI为何需要庞大计算能力

OpenAI及其合作伙伴抛出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人难以置信。例如,10吉瓦相当于大约10座核电站的发电量,足以为数百万户家庭供电。但OpenAI真的需要这些数据中心做什么?一切都源于OpenAI首席执行官萨姆·奥尔特曼向数十亿人提供智能即服务的梦想。

"只有构建算力来支持AI,AI才能实现其承诺,"奥尔特曼在公告中表示,"这种算力是确保每个人都能从AI中受益并解锁未来突破的关键。"

Stargate I site construction

奥尔特曼的言论反映了他对未来AI系统实用性的乐观态度。尽管有关于AI泡沫的警告和对底层技术的批评,但生成式AI容量今天仍有未满足的需求。ChatGPT服务7亿周活跃用户,超过美国人口的两倍,他们经常使用这个AI助手开发软件、提供个人建议以及撰写或编辑信函和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。

OpenAI经常面临严重的容量限制问题,导致对其用户查询聊天机器人的频率进行限制。ChatGPT Plus订阅用户经常遇到这些使用限制,特别是在使用图像生成或模拟推理模型等计算密集型功能时。代表未来订阅入口的免费用户面临更严格的限制。OpenAI缺乏满足当前需求的计算能力,更不用说为未来增长留出空间了。

训练下一代AI模型加剧了这一问题。除了运行支持ChatGPT的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。

循环投资谜题:AI金融游戏的本质

OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察家的密切关注。本周早些时候,Nvidia宣布将投资高达1000亿美元,同时OpenAI部署Nvidia系统。正如Requisite Capital Management的布琳·塔金顿对CNBC所说:"Nvidia向OpenAI投资1000亿美元,而OpenAI又将其返还给Nvidia。"

Oracle的安排遵循类似模式,据报道这是一项每年300亿美元的协议,Oracle建设设施供OpenAI付费使用。这种涉及基础设施提供商投资于AI公司的循环流动,而这些AI公司又成为他们最大的客户,引发了人们的质疑,认为这些代表真正的经济投资还是精心设计的会计操作。

这些安排正变得愈发复杂。《信息》本周报道,Nvidia正在讨论向OpenAI租赁其芯片,而不是直接出售。在这种结构下,Nvidia将创建一个单独实体来购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系增添了另一层循环财务工程。

上周,科技评论家埃德·齐特伦在Bluesky上写道:"Nvidia培育公司并给予他们获得债务购买GPU的保证合同,尽管这些公司严重亏损,并最终因缺乏真正的需求而消亡。"齐特伦指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务,部分基于Nvidia自身的合同购买Nvidia GPU。这种模式反映了OpenAI与Oracle和Nvidia的安排。

泡沫风险:当AI基建遭遇现实需求

那么,如果泡沫破裂会怎样?即使是奥尔特曼本人上月也警告称,在他所称的AI泡沫中,"有人将损失巨额金钱"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会简单地消失。当2001年互联网泡沫破裂时,在繁荣时期铺设的光纤电缆最终随着互联网需求的增长而找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但投资者可能要为AI繁荣时期支付的价格付出巨大代价。

算力竞赛:AI巨头的新战场

OpenAI的基建扩张并非孤例,而是整个行业算力竞赛的缩影。微软、谷歌、亚马逊等科技巨头都在竞相投资AI基础设施,以确保在AI时代保持竞争优势。这种军备竞赛不仅推动了计算能力的指数级增长,也重塑了全球能源格局。

数据中心选址策略也反映了这一趋势。OpenAI选择的站点大多位于德克萨斯州等能源丰富且气候适宜的地区,这表明数据中心选址已从传统的技术集群转向能源可获得性和可持续性考量。

未来展望:AI基础设施的可持续性

面对质疑,OpenAI及其合作伙伴坚称这些投资是对未来技术发展的必要投入。随着AI模型规模持续扩大,训练和推理所需的计算能力呈指数级增长。今天的"过度投资"可能只是明天的"必要基础设施"。

然而,循环投资模式的风险不容忽视。当主要投资者同时也是主要客户时,市场信号可能被扭曲,导致资源配置效率低下。这种模式在短期内可能推动技术进步,但长期来看可能阻碍真正的创新和市场竞争。

结语:算力与商业的平衡艺术

OpenAI的六座巨型数据中心计划代表了AI技术发展的一个关键时刻。一方面,大规模计算基础设施确实是推动AI进步的必要条件;另一方面,当前的投资热潮可能包含过度泡沫和金融工程成分。

未来几年,我们将看到这种循环投资模式是否能够持续,以及AI需求是否能够支撑这些庞大的基础设施。无论结果如何,OpenAI的基建豪赌已经改变了科技行业的格局,为AI时代的基础设施建设设定了新的标准。