OpenAI的六大数据中心:AI基础设施的循环投资之谜

1

在科技行业的发展史上,很少有哪家公司能在如此短的时间内宣布如此庞大的基础设施投资计划。然而,OpenAI正这样做——这家人工智能领域的领军企业近期与Oracle和软银共同宣布,将建设五座新的美国AI数据中心,将其Stargate平台的规划容量提升至近7吉瓦,未来三年的投资额将超过4000亿美元。

这一宏大的扩张计划旨在应对ChatGPT每周7亿用户的需求,并为未来的AI模型训练提供支持。尽管有批评者质疑这种投资结构能否持续,但这些公司表示,此次扩张使他们有望在2025年底前实现1月份宣布的5000亿美元、10吉瓦的完整承诺。

六大Stargate站点分布

这五座新站点将包括三个通过OpenAI与Oracle合作伙伴关系开发的地点:德克萨斯州的谢尔克福德县、新墨西哥州的唐娜安娜县以及一个未公开的中西部地点。这些站点加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建项目,可提供超过5.5吉瓦的容量,这意味着现场计算机在满负荷运行时能够消耗高达55亿瓦的电力。这些公司预计这些站点将创造超过25,000个现场工作岗位。

Stargate I站点 德克萨斯州阿比林"Stargate I"站点实景

另外两个站点将通过软银与OpenAI的合作伙伴关系开发。一个位于俄亥俄州洛德斯顿的站点,软银已开始动工,预计明年投入运营。第二个站点位于德克萨斯州的米拉姆县,将与软银集团旗下的SB Energy共同开发。这两个站点在未来18个月内可能扩展至1.5吉瓦。

新站点将与德克萨斯州阿比林的旗舰Stargate校园一起构成OpenAI的六大核心数据中心。Oracle已于6月开始向该站点交付Nvidia硬件,OpenAI已经开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。

以下是迄今为止宣布的Stargate站点概览:

  • 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
  • 谢尔克福德县,德克萨斯州:新的Oracle开发站点
  • 唐娜安娜县,新墨西哥州:新的Oracle开发站点
  • 中西部地点(未公开):新的Oracle开发站点
  • 洛德斯顿,俄亥俄州:新的软银开发站点,明年运营
  • 米拉姆县,德克萨斯州:新的软银/SB能源站点

OpenAI为何需要如此庞大的计算能力

OpenAI及其合作伙伴抛出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人难以置信。例如,10吉瓦相当于大约10座核电站的发电量,足以为数百万家庭供电。但OpenAI真的需要这些数据中心做什么?这一切都源于OpenAI首席执行官Sam Altman为数十亿人提供智能即服务的梦想。

"只有构建驱动AI的计算能力,AI才能实现其承诺,"OpenAI首席执行官Sam Altman在公告中表示。"这种计算能力是确保每个人都能从AI中受益并解锁未来突破的关键。"

Altman的陈述反映了他对未来AI系统有用性的乐观态度,但尽管有人警告存在AI泡沫并批评底层技术,目前对生成式AI能力仍有未满足的实际需求。ChatGPT每周有7亿活跃用户,是美国人口的两倍多,他们经常使用AI助手来开发软件、提供个人建议以及撰写或编辑信函和报告。尽管输出有时可能不完美,但人们显然仍然需要它们。

OpenAI经常面临严重的产能限制来产生这些输出,这导致对其用户查询聊天机器人的频率有限制。ChatGPT Plus订阅用户经常遇到这些使用限制,尤其是在使用图像生成或模拟推理模型等计算密集型功能时。作为未来订阅入口的免费用户则面临更严格的限制。OpenAI缺乏满足当前需求的计算能力,更不用说未来增长的空间了。

训练下一代AI模型使问题更加复杂。除了运行驱动ChatGPT的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。

循环投资问题

OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察者的审视。本周早些时候,Nvidia宣布将投资高达1000亿美元,同时OpenAI部署Nvidia系统。正如Requisite Capital Management的Bryn Talkington告诉CNBC的那样:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"

数据中心建设 大型数据中心建设实景

Oracle的安排遵循类似模式,据报道是一项每年300亿美元的协议,Oracle建设OpenAI付费使用的设施。这种循环流动——基础设施提供商投资于AI公司,而这些AI公司成为他们最大的客户——引发了人们质疑这些是否代表真正的经济投资还是复杂的会计操作。

这些安排正变得日益复杂。《The Information》本周报道,Nvidia正在讨论向OpenAI租赁芯片而非直接出售。在这种结构下,Nvidia将创建一个独立实体购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系又增加了一层循环财务工程。

"Nvidia为这些公司提供资金,并给予他们必要的保证合同,以便他们能够借债购买Nvidia的GPU,尽管这些公司严重亏损,并最终会因缺乏任何实际需求而消亡,"科技评论家Ed Zitron上周在Bluesky上写道,他指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务购买Nvidia GPU,部分基于Nvidia自身的合同。这种模式反映了OpenAI与Oracle和Nvidia的合作安排。

如果泡沫破裂会怎样?

那么,如果泡沫破裂会发生什么?即使是Altman本人上个月也警告称,在他称之为"AI泡沫"的领域中,"有人将损失惊人的金钱"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会 simply 消失。当2001年互联网泡沫破裂时,在繁荣时期铺设的光纤电缆最终随着互联网需求的增长找到了用途。类似地,这些设施可能会转向云服务、科学计算或其他工作负载,但对于支付AI繁荣价格的投资者来说,可能会造成巨大损失。

技术与经济的双重挑战

OpenAI的扩张计划不仅面临经济可持续性的质疑,还面临着技术挑战。随着模型规模的不断扩大,训练和运行这些模型所需的能源也在呈指数级增长。7吉瓦的电力需求相当于一座中型城市的总用电量,这引发了关于能源供应和碳足迹的担忧。

此外,AI模型的性能提升是否能够跟上计算能力的增长也是一个悬而未决的问题。目前,业界已经观察到模型规模扩大带来的收益递减现象,这意味着即使投入更多的计算资源,性能提升也可能不成比例。

行业影响与未来展望

OpenAI的Stargate项目不仅仅是一家公司的扩张计划,它可能重塑整个AI行业的格局。如此大规模的基础设施建设可能会提高行业进入门槛,使小型AI公司更难与拥有庞大计算资源的巨头竞争。

同时,这种循环投资模式可能会改变科技行业的投资逻辑。传统的风险投资模式正在被这种由芯片制造商、云服务提供商和AI公司共同构建的复杂生态系统所取代。这种模式虽然在短期内能够推动快速扩张,但长期可持续性仍有待观察。

结论

OpenAI的六大数据中心计划代表了AI基础设施建设的巅峰之作,同时也反映了行业对未来的乐观预期与谨慎担忧。在循环投资模式的推动下,这种大规模扩张可能会加速AI技术的发展,但也存在泡沫破裂的风险。无论未来如何发展,这一计划都将成为科技史上一个值得研究的案例,为我们理解数字基础设施投资的极限与可能性提供重要参考。