AI基础设施的奥罗伯罗斯:OpenAI为何需要六大超级数据中心

1

OpenAI近期与Oracle和软银共同宣布了一项震撼业界的计划:在美国建设五个新的AI数据中心,将其Stargate项目的总规划容量提升至近7吉瓦,投资额超过4000亿美元,计划在未来三年内完成。这一庞大的基础设施建设不仅彰显了AI需求的快速增长,更揭示了一种引人深思的循环投资模式。

OpenAI Stargate项目数据中心

Stargate项目的宏伟蓝图

周二,OpenAI、Oracle和软银共同宣布了Stargate项目的最新进展。这个由三方合作的AI基础设施项目计划新增五个美国数据中心站点,使平台总规划容量达到近7吉瓦,未来三年内的投资额将超过4000亿美元。这一大规模扩建旨在应对ChatGPT每周7亿用户的需求,并训练未来的AI模型,尽管批评人士质疑这种投资结构能否持续。

OpenAI Stargate项目施工现场

据公司透露,此次扩张使他们有望在2025年底前实现1月份宣布的5000亿美元、10吉瓦承诺的全部目标。五个新站点包括三个通过OpenAI与Oracle合作开发的地点:德克萨斯州的谢尔克福德县、新墨西哥州的唐娜安娜县,以及一个未公开的中西部地点。这些站点加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建项目,可提供超过5.5吉瓦的容量,意味着现场计算机在满负荷运行时可消耗高达55亿瓦的电力。公司预计这些站点将创造超过25,000个现场工作岗位。

另外两个站点将由软银与OpenAI合作开发。一个位于俄亥俄州洛德斯顿的站点已经动工,预计明年投入运营。第二个位于德克萨斯州米拉姆县的站点将由软银集团旗下的SB Energy开发。这两个站点在未来18个月内可能扩展至1.5吉瓦。

这些新站点将与德克萨斯州阿比林的旗舰Stargate校园合并。Oracle于6月开始向该站点交付Nvidia硬件,OpenAI已开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。

已公布的Stargate站点概览

截至目前,已公布的Stargate站点包括:

  • 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
  • 谢尔克福德县,德克萨斯州:新Oracle开发站点
  • 唐娜安娜县,新墨西哥州:新Oracle开发站点
  • 中西部地区(未公开):新Oracle开发站点
  • 洛德斯顿,俄亥俄州:新软银开发站点,明年投入运营
  • 米拉姆县,德克萨斯州:新软银/SB Energy站点

7月,OpenAI与Oracle达成的协议将开发额外4.5吉瓦Stargate容量,标志着两家公司五年内价值超过3000亿美元的合作。公司表示,在1月启动的全美流程中,他们审查了来自30多个州的300多个提案后选择了这五个新站点。

OpenAI为何需要庞大的计算能力

OpenAI及其合作伙伴提出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人难以置信。例如,10吉瓦相当于大约10座核电站的输出,足以为数百万家庭提供电力。但OpenAI真正需要这些数据中心做什么呢?这一切都源于OpenAI首席执行官Sam Altman为数十亿人提供智能即服务的梦想。

"AI只有在构建支持它的计算能力时才能实现其承诺,"OpenAI首席执行官Sam Altman在公告中表示。"这种计算能力是确保每个人都能从AI中受益并解锁未来突破的关键。"

Altman的言论反映了他对未来AI系统实用性的乐观态度,但尽管存在对AI泡沫和底层技术的警告,目前生成式AI能力仍存在未被满足的实际需求。ChatGPT服务7亿周活跃用户,超过美国人口的两倍,他们经常使用AI助手开发软件、提供个人建议,以及撰写或编辑信函和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。

OpenAI经常面临严重的容量限制,导致对其用户查询聊天机器人的频率有限制。ChatGPT Plus订阅用户经常遇到这些使用限制,特别是在使用图像生成或模拟推理模型等计算密集型功能时。代表未来订阅入口的免费用户则面临更严格的限制。OpenAI缺乏满足当前需求的计算能力,更不用说为未来增长留出空间了。

训练下一代AI模型使问题更加复杂。除了运行支持ChatGPT的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。

循环投资的问题

OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察家的密切关注。本周早些时候,Nvidia宣布将投资高达1000亿美元,同时OpenAI部署Nvidia系统。正如Requisite Capital Management的Bryn Talkington对CNBC所说:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"

Oracle的安排遵循类似模式,据报道每年有300亿美元的交易,Oracle建设OpenAI付费使用的设施。这种涉及基础设施提供商投资于AI公司的循环流动,而这些公司又成为他们最大的客户,引发了人们对这些代表真实经济投资还是复杂会计操作的质疑。

这些安排正变得更加复杂。《The Information》本周报道,Nvidia正在讨论向OpenAI租赁其芯片,而不是直接出售。根据这种结构,Nvidia将创建一个独立实体购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系又增加了一层循环财务工程。

"Nvidia培育公司并给予它们必要的保证合同,以便它们能够筹集债务来购买Nvidia的GPU,即使这些公司严重亏损并最终因缺乏真正的需求而消亡,"科技评论家Ed Zitron上周在Bluesky上写道,他指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务来购买Nvidia GPU,部分基于Nvidia自身的合同。Zitron指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务来购买Nvidia GPU,部分基于Nvidia自身的合同。这种模式反映了OpenAI与Oracle和Nvidia的安排。

如果泡沫破裂会怎样?

如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会简单地消失。当2001年互联网泡沫破裂时,繁荣时期铺设的光纤电缆最终随着互联网需求的增长而找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但可能会给支付AI繁荣价格的投资者带来巨大损失。

Altman本人上月就警告称,"有人将在他所谓的AI泡沫中损失惊人的一笔钱"。如果AI需求无法满足这些预测,这些物理上建立的大型数据中心不会简单地消失。当2001年互联网泡沫破裂时,繁荣时期铺设的光纤电缆最终随着互联网需求的增长而找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但可能会给支付AI繁荣价格的投资者带来巨大损失。

结论:AI基础设施的复杂经济生态

OpenAI的扩张战略揭示了AI产业的一个悖论:一方面是对计算能力的迫切需求,另一方面是复杂的财务结构。这种循环投资模式——芯片制造商投资AI公司,而这些公司又成为其最大客户——创造了一种相互依存的经济生态,但也带来了潜在的风险。

随着AI技术的不断发展和应用场景的扩展,这些大型数据中心可能会在未来找到新的用途,就像互联网泡沫后的光纤一样。然而,当前的繁荣是否能够持续,以及这种投资模式是否能够创造真正的长期价值,仍然是业界关注的焦点。无论如何,AI基础设施建设的规模和速度,已经深刻地改变了科技产业的格局,并将继续塑造未来的数字世界。