OpenAI的六座巨型数据中心:AI基础设施的无限循环

0

OpenAI近期宣布与Oracle和软银合作,计划在美国新建五座AI数据中心,将其Stargate平台的规划容量提升至近7吉瓦,未来三年投资额将超过4000亿美元。这一庞大的扩张计划旨在处理ChatGPT每周7亿的用户量,并训练未来的AI模型,尽管批评人士质疑这种投资结构能否持续。公司表示,这一扩张使他们有望在2025年底前实现1月份宣布的5000亿美元、10吉瓦的承诺。

六大数据中心的布局与规模

五座新数据中心将包括三个通过OpenAI和Oracle合作开发的位置:德克萨斯州的谢尔克福德县、新墨西哥州的唐娜安娜县以及一个未公开的中西部地点。这些站点,加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建项目,可提供超过5.5吉瓦的容量,这意味着现场计算机在满负荷运行时能够消耗高达55亿瓦的电力。这些公司预计这些站点将创造超过25,000个现场工作岗位。

另外两个站点将通过软银和OpenAI之间的合作开发。俄亥俄州洛德斯顿的一个站点已经破土动工,预计明年可投入使用。德克萨斯州米尔姆县的第二个站点将与软银集团旗下的SB Energy公司共同开发。这两个站点在未来18个月内可能扩展至1.5吉瓦。

新站点将与德克萨斯州阿比林的旗舰Stargate校园合并。Oracle从6月开始向该站点交付Nvidia硬件,OpenAI已经开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。

以下是迄今为止宣布的Stargate站点概览:

  • 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
  • 谢尔克福德县,德克萨斯州:新Oracle开发站点
  • 唐娜安娜县,新墨西哥州:新Oracle开发站点
  • 中西部地点(未公开):新Oracle开发站点
  • 洛德斯顿,俄亥俄州:新软银开发站点,明年投入使用
  • 米尔姆县,德克萨斯州:新软银/SB Energy站点

OpenAI Stargate数据中心

OpenAI为何需要庞大的计算能力

OpenAI及其合作伙伴提出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人震惊且难以理解。例如,10吉瓦相当于大约10座核电站的发电量,足以为数百万家庭供电。但OpenAI真的需要这些数据中心做什么呢?这都源于OpenAICEO山姆·奥特曼(Sam Altman)为数十亿人提供智能即服务的梦想。

"AI只有在构建计算能力的前提下才能实现其承诺,"OpenAICEO山姆·奥特曼在公告中表示,"这种计算能力是确保每个人都能从AI中受益并解锁未来突破的关键。"

奥特曼的言论反映了他对未来AI系统有用性的乐观态度,但尽管存在AI泡沫警告和对底层技术的批评,目前对生成式AI容量的实际需求仍未得到满足。ChatGPT每周服务7亿活跃用户,超过美国人口的两倍,他们经常使用这个AI助手来开发软件、提供个人建议以及撰写或编辑信件和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。

OpenAI经常面临严重的容量限制来产生这些输出,这导致对其用户查询聊天机器人的频率有限制。ChatGPT Plus订阅者经常遇到这些使用限制,特别是在使用图像生成或模拟推理模型等计算密集型功能时。作为未来订阅入口的免费用户,面临的限制更为严格。OpenAI缺乏满足当前需求的计算能力,更不用说未来增长的空间了。

数据中心内部设施

训练下一代AI模型加剧了这一问题。除了运行支持ChatGPT的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。

循环投资的问题

OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察者的密切关注。本周早些时候,Nvidia宣布将投资高达1000亿美元,因为OpenAI部署Nvidia系统。正如Requisite Capital Management的布赖恩·塔金顿(Bryn Talkington)告诉CNBC的那样:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"

Oracle的安排遵循了类似的模式,据报道这是一笔每年300亿美元的协议,Oracle建设OpenAI付费使用的设施。这种循环流动,涉及基础设施提供商投资于AI公司,而这些公司又成为他们最大的客户,引发了人们的质疑,认为这些代表真正的经济投资还是复杂的会计操作。

这些安排正变得更加复杂。《信息》本周报道,Nvidia正在讨论将其芯片租赁给OpenAI,而不是直接出售。根据这种结构,Nvidia将创建一个单独实体来购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系又增加了一层循环金融工程。

"Nvidia为这些公司提供种子资金,并给予他们必要的保证合同,以便他们能够借债购买Nvidia的GPU,即使这些公司严重亏损,并且最终会因缺乏任何真正的需求而消亡,"科技评论家埃德·齐特龙(Ed Zitron)上周在Bluesky上写道,他指的是CoreWeave和Lambda Labs等公司,这些公司已经筹集了数十亿美元债务,部分基于Nvidia自身的合同来购买Nvidia GPU。这种模式反映了OpenAI与Oracle和Nvidia的合作安排。

如果泡沫破裂会怎样?

即使奥特曼本人上个月也警告称,在他称之为AI泡沫的领域中,"有人将损失惊人 amount of money"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会简单地消失。当2001年互联网泡沫破裂时,在繁荣时期铺设的光纤电缆最终在互联网需求赶上时找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但可能会给支付AI繁荣价格的投资者带来巨大损失。

OpenAI的数据中心扩张计划代表了AI基础设施发展的一个关键时刻。一方面,这种大规模投资反映了AI技术的实际需求和潜力;另一方面,复杂的投资循环和潜在的泡沫风险提醒我们需要保持清醒的头脑。随着AI技术的不断发展和应用场景的拓展,这些数据中心可能会在未来几年内重新定义我们对计算能力的认知和利用方式。

结论

OpenAI的六座巨型数据中心计划不仅是技术发展的必然结果,也是商业策略的重要组成部分。在AI技术快速迭代的市场环境中,计算能力已经成为决定竞争力的关键因素。然而,这种大规模投资也带来了新的挑战和风险,需要投资者、开发者和政策制定者共同思考和应对。未来,随着AI技术的成熟和应用场景的拓展,这些数据中心可能会在更广泛的计算生态系统中找到自己的位置和价值。