OpenAI的基建困局:六大数据中心背后的AI需求与循环投资迷局

1

OpenAI Stargate项目数据中心

OpenAI近期宣布与Oracle和软银合作建设五座新的人工智能数据中心,将Stargate项目总容量提升至近7吉瓦,投资额超过4000亿美元。这一庞大扩张计划旨在应对ChatGPT每周7亿用户的计算需求,并为未来AI模型训练提供基础设施。然而,这一投资结构引发了行业对可持续性的质疑。本文将深入分析OpenAI为何需要如此庞大的计算能力,探讨其与Oracle、Nvidia等合作伙伴之间复杂的循环投资模式,并评估这种大规模基建投入在AI泡沫风险下的潜在影响与转型可能。

六大数据中心的宏伟蓝图

周二,OpenAI、Oracle和软银宣布了Stargate项目的五座新美国AI数据中心建设计划,该项目旨在将平台总规划容量提升至近7吉瓦,未来三年投资额超过4000亿美元。

Stargate项目Abilene站点

这一庞大的扩张计划旨在处理ChatGPT每周7亿的用户量并训练未来AI模型,尽管批评人士质疑这种投资结构是否能够持续。这些公司表示,此次扩张使他们有望在2025年底前获得他们在今年1月宣布的5000亿美元、10吉瓦的完整承诺。

五座新站点包括三个通过OpenAI和Oracle合作伙伴关系开发的地点:德克萨斯州的谢尔克福德县、新墨西哥州的唐娜安娜县以及一个未公开的中西部地点。这些站点加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建项目,可提供超过5.5吉瓦的容量,这意味着现场计算机在满负荷运行时能够汲取多达55亿瓦的电力。这些公司预计这些站点将创造超过25,000个现场工作岗位。

两座站点将通过软银和OpenAI之间的合作伙伴关系开发。俄亥俄州洛兹敦的一座站点软银已开始动工,有望在明年投入运营。德克萨斯州米拉姆县的第二座站点将与软银集团旗下的SB Energy公司共同开发。这两座站点在未来18个月内可能扩展至1.5吉瓦。

新站点将与德克萨斯州阿比林的旗舰Stargate校园一起加入网络。Oracle于6月开始向该站点交付Nvidia硬件,OpenAI已经开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。

Stargate站点分布一览

  • 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
  • 谢尔克福德县,德克萨斯州:新Oracle开发站点
  • 唐娜安娜县,新墨西哥州:新Oracle开发站点
  • 中西部地点(未公开):新Oracle开发站点
  • 洛兹敦,俄亥俄州:新软银开发站点,明年运营
  • 米拉姆县,德克萨斯州:新软银/SB Energy站点

OpenAI为何需要庞大计算能力

OpenAI及其合作伙伴抛出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人震惊且难以理解。例如,10吉瓦相当于大约10座核电站的发电量,足以为数百万家庭供电。但OpenAI真正需要这些数据中心做什么呢?这都源于OpenAI首席执行官Sam Altman为全球数十亿人提供智能即服务的梦想。

"只有构建计算能力,AI才能实现其承诺,"OpenAI首席执行官Sam Altman在公告中表示。"这种计算能力是确保每个人都能从AI中受益并解锁未来突破的关键。"

Altman的言论反映了他对未来AI系统实用性的乐观态度,但尽管存在AI泡沫警告和对底层技术的批评,目前生成式AI能力仍有实际未满足的需求。ChatGPT服务7亿周活跃用户,是美国人口的两倍多,这些用户经常使用AI助手开发软件、提供个人建议以及撰写或编辑信函和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。

OpenAI经常面临严重的容量限制来产生这些输出,这导致对其用户查询聊天机器人的频率有限制。ChatGPT Plus订阅用户经常遇到这些使用限制,特别是在使用图像生成或模拟推理模型等计算密集型功能时。作为未来订阅入口的免费用户面临的限制更为严格。OpenAI缺乏满足当前需求的计算能力,更不用说为未来增长留出空间。

训练下一代AI模型加剧了这一问题。除了运行为ChatGPT提供动力的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。

循环投资的疑问

OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察人士的审视。本周早些时候,Nvidia宣布将在OpenAI部署Nvidia系统时投资高达1000亿美元。正如Requisite Capital Management的Bryn Talkington告诉CNBC的那样:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"

Oracle的安排遵循类似模式,据报道这是一份每年300亿美元的协议,Oracle建设OpenAI付费使用的设施。这种涉及基础设施提供商投资于AI公司而这些公司又成为他们最大客户的循环流动,引发了人们对这些代表真正的经济投资还是复杂的会计操作的质疑。

这些安排正变得更加复杂。《信息》本周报道,Nvidia正在讨论向OpenAI出租其芯片,而不是直接出售。根据这种结构,Nvidia将创建一个单独实体来购买自己的GPU,然后将其出租给OpenAI,这为这种复杂的关系又增加了一层循环金融工程。

科技评论家Ed Zitron上周在Bluesky上关于AI基础设施投资的异常流动写道:"NVIDIA培育公司并给予他们获得债务购买GPU的保证合同,尽管这些公司严重亏损,并最终因缺乏任何实际需求而消亡。"Zitron指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务购买Nvidia GPU,部分基于Nvidia自身的合同。这种模式反映了OpenAI与Oracle和Nvidia之间的安排。

泡沫破裂后的思考

那么,如果泡沫破裂会发生什么?即使是Altman本人上个月也警告称,在他称之为AI泡沫的领域中,"有人将损失巨额金钱"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会简单消失。当2001年互联网泡沫破裂时,繁荣时期铺设的光纤电缆最终随着互联网需求的增长而找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但可能会给支付AI繁荣价格的投资者带来巨大损失。

数据中心的潜在转型

尽管存在风险,这些大型数据中心仍有可能找到新的用途。随着AI技术的成熟,这些设施可以:

  1. 转向通用云计算:当特定AI需求下降时,可以转型为提供传统云计算服务
  2. 支持科学研究:为气候模拟、药物研发等需要大量计算能力的科学领域提供支持
  3. 边缘计算基础设施:随着物联网设备增长,这些数据中心可以支持边缘计算需求
  4. AI模型托管服务:为其他公司提供预训练AI模型的托管服务

投资模式的可持续性

当前的投资循环模式引发了对长期可持续性的担忧:

  • 价格泡沫风险:当前GPU和数据中心建设价格可能存在泡沫
  • 回报周期延长:AI投资的回报周期可能比预期更长
  • 技术迭代风险:AI技术快速迭代可能导致当前基础设施快速过时
  • 监管不确定性:AI监管政策变化可能影响投资回报

结论:基建狂潮背后的理性思考

OpenAI的六大数据中心计划反映了AI产业对算力的极度渴求,同时也暴露了当前投资模式的潜在风险。虽然Sam Altman等行业领袖对AI的未来充满信心,但市场需要警惕过度投资和循环财务结构可能带来的系统性风险。

无论如何,这些大型数据中心的建设代表了AI基础设施的重要里程碑,无论未来如何演变,它们都将成为数字基础设施的重要组成部分。关键在于如何确保这些投资能够产生真正的技术进步和经济效益,而非仅仅是金融工程的产物。