在当今科技界,OpenAI、Oracle和软银联合宣布的Stargate项目无疑是2025年最具震撼力的消息之一。这个价值4000亿美元的基础设施计划将在美国建设六座大型AI数据中心,总容量近7吉瓦。这一惊人投资不仅反映了ChatGPT每周7亿用户的巨大需求,也揭示了AI产业中复杂的循环投资模式。本文将深入探讨OpenAI为何需要如此庞大的计算能力,以及这种基础设施扩张背后的技术需求与经济逻辑。
Stargate项目的宏伟蓝图
2025年9月,OpenAI、Oracle和软银共同宣布了Stargate项目的最新进展——计划在美国建设五座新的AI数据中心,使该平台的规划总容量达到近7吉瓦,未来三年的投资额超过4000亿美元。这一庞大的扩建计划旨在处理ChatGPT每周7亿的用户量,并训练未来的AI模型。
这五座新数据中心包括三个通过OpenAI和Oracle合作开发的位置:德克萨斯州的谢尔福德县、新墨西哥州的唐娜安娜县,以及一个未公开的中西部地点。这些站点,加上德克萨斯州阿比林旗舰Stargate站点附近的600兆瓦扩建项目,可提供超过5.5吉瓦的容量,这意味着当站点满负荷运行时,其计算机最多可消耗55亿瓦的电力。这些公司预计这些站点将创造超过25,000个现场工作岗位。
另外两个站点将通过软银和OpenAI的合作伙伴关系开发。位于俄亥俄州洛兹敦的一个站点,软银已破土动工,预计明年投入运营。位于德克萨斯州米尔姆县的第二个站点将与软银集团旗下的SB Energy共同开发。这两个站点在未来18个月内可能扩展到1.5吉瓦。
这些新站点将与德克萨斯州阿比林的旗舰Stargate校园一起构成OpenAI庞大的基础设施网络。Oracle已于6月开始向该站点运送Nvidia硬件,OpenAI已经开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。
已宣布的Stargate站点概览
- 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
- 谢尔福德县,德克萨斯州:新Oracle开发站点
- 唐娜安娜县,新墨西哥州:新Oracle开发站点
- 中西部地点(未公开):新Oracle开发站点
- 洛兹敦,俄亥俄州:新软银开发站点,明年运营
- 米尔姆县,德克萨斯州:新软银/SB能源站点
德克萨斯州阿比林"Stargate I"站点施工现场,OpenAI与Oracle合作建设的大型AI基础设施项目
OpenAI为何需要巨大计算能力
OpenAI及其合作伙伴提出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,范围之广令人难以理解。例如,10吉瓦相当于大约10座核反应机的输出,足以为数百万家庭供电。但OpenAI真正需要这些数据中心做什么呢?这一切都源于OpenAI首席执行官Sam Altman为数十亿人提供智能即服务的梦想。
"只有构建计算能力才能实现AI的承诺,"OpenAI首席执行官Sam Altman在公告中表示。"这种计算是确保每个人都能从AI中受益并解锁未来突破的关键。"
Altman的言论反映了未来AI系统潜力的乐观态度,尽管有人警告AI泡沫并批评底层技术,但目前对生成式AI容量仍存在实际未满足的需求。ChatGPT每周有7亿活跃用户,超过美国人口的两倍,他们经常使用这个AI助手来开发软件、提供个人建议,以及撰写或编辑信函和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。
OpenAI经常面临严重的容量限制来产生这些输出,这导致对其用户可以查询聊天机器人的频率有限制。ChatGPT Plus订阅者经常遇到这些使用限制,尤其是在使用图像生成或模拟推理模型等计算密集型功能时。作为未来订阅入口的免费用户,面临更严格的限制。OpenAI缺乏满足当前需求的计算能力,更不用说未来增长的空间了。
训练下一代AI模型加剧了这一问题。除了运行支持ChatGPT的现有AI模型外,OpenAI还在后台不断开发新技术。这个过程需要数千个专用芯片连续运行数月。
计算需求的指数级增长
AI模型的计算需求呈现指数级增长。与早期模型相比,现代大型语言模型(LLM)需要更多的计算资源。例如,GPT-3的训练需要数千GPU核心运行数周,而GPT-4则需要更多资源。随着模型规模和复杂度的增加,这一趋势预计将持续下去。
此外,推理服务——即运行训练好的模型为用户提供响应——也需要大量计算资源。随着用户数量和每个用户查询复杂度的增加,推理需求也在快速增长。OpenAI需要平衡训练新模型与为现有用户提供高质量服务之间的资源分配。
循环投资的问题
OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察者的密切关注。本周早些时候,Nvidia宣布将投资高达1000亿美元,同时OpenAI部署Nvidia系统。正如Requisite Capital Management的Bryn Talkington告诉CNBC的那样:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"
Oracle的安排遵循类似的模式,据报道是一项每年300亿美元的交易,Oracle建设OpenAI付费使用的设施。这种循环流动——基础设施提供商投资于AI公司,而这些公司又成为他们最大的客户——引发了人们质疑这些是否代表真正的经济投资还是复杂的会计操作。
这些安排正变得越来越复杂。《信息》本周报道,Nvidia正在讨论将其芯片租赁给OpenAI,而不是直接出售。根据这种结构,Nvidia将创建一个单独实体来购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系又增加了一层循环财务工程。
科技评论家Ed Zitron在Bluesky上写道:"Nvidia为这些公司提供种子资金,并给予他们必要的保证合同,以便他们能够筹集债务来购买Nvidia的GPU,即使这些公司严重亏损,最终会因缺乏任何真正的需求而消亡。"Zitron指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务来购买Nvidia GPU,部分基于Nvidia自身的合同。这种模式反映了OpenAI与Oracle和Nvidia的安排。
泡沫破裂的潜在风险
那么,如果泡沫破裂会发生什么?即使Altman本人上个月也警告称,在他称之为"AI泡沫"的领域中,"有人将损失大量金钱"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会简单地消失。当2001年互联网泡沫破裂时,繁荣时期铺设的光纤电缆最终在互联网需求赶上时找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但投资者可能为此付出巨大代价。
AI计算能力与能源消耗关系示意图,展示大型AI数据中心对电力资源的巨大需求
数据中心选址的战略考量
OpenAI及其合作伙伴在选择数据中心地点时考虑了多种因素。德克萨斯州成为多个站点的选择,主要归功于其相对较低的电力成本和有利的监管环境。阿比林作为旗舰站点,可能还考虑了地理位置和基础设施的便利性。
新墨西哥州和俄亥俄州等其他地点的选择则可能基于电力可用性、土地成本和当地激励措施。Oracle和软银在评估超过300份来自30多个州的提案后选择了这些地点,表明这是一个经过深思熟虑的过程。
能源与可持续性的挑战
如此大规模的数据中心建设面临的主要挑战之一是能源供应和可持续性。7吉瓦的电力需求相当于几个大型核电站的输出,这给电网带来了巨大压力。此外,AI计算的高能耗也引发了环境担忧。
为应对这些挑战,OpenAI及其合作伙伴可能需要投资可再生能源项目,提高能源效率,或开发更节能的AI算法。这些措施不仅能减轻环境负担,还可能降低长期运营成本。
AI基础设施的经济模式
OpenAI与Oracle和Nvidia的合作模式代表了AI基础设施领域的一种新兴经济模式。在这种模式中,硬件供应商、基础设施提供商和AI开发商形成紧密的生态系统,通过交叉投资和长期合同确保彼此的业务可持续性。
这种模式的优势在于能够降低各方风险。Oracle通过长期合同获得稳定的收入,OpenAI确保了计算资源的可用性,而Nvidia则锁定了GPU的销售。然而,这种相互依存的关系也创造了潜在的脆弱性,如果任何一方出现问题,整个生态系统可能受到影响。
循环投资的双面性
循环投资模式既有优势也有风险。从积极方面看,它加速了AI基础设施的发展,使各方能够分担初始投资风险。从消极方面看,它可能导致资源错配,如果AI需求不如预期,可能导致大量资产闲置。
此外,这种复杂的财务结构可能掩盖了实际的盈利能力和可持续性。批评者认为,这些交易可能更多是为了会计和估值目的,而非真正的经济价值创造。
未来展望:AI基础设施的发展趋势
展望未来,AI基础设施的发展可能呈现几个关键趋势。首先,随着AI技术的进步,对计算资源的需求将继续增长,可能需要更大规模和更高效的数据中心。
其次,能源效率将成为设计AI数据中心的关键考虑因素。随着对可持续性的关注增加,我们可能会看到更多使用可再生能源和先进冷却技术的设施。
最后,AI基础设施的地理分布可能更加多样化,以减少对单一地区的依赖,并更好地利用全球各地的能源和人才资源。
技术创新的推动作用
技术创新将继续塑造AI基础设施的未来。更高效的芯片设计、优化的算法和改进的架构都可能减少计算需求。此外,边缘计算和分布式AI模型的发展可能减少对大型集中式数据中心的依赖。
然而,尽管这些创新可能提高效率,但AI能力的持续扩展可能会抵消这些收益,导致对计算资源的需求持续增长。这种技术进步与需求增长之间的竞赛将成为AI基础设施发展的核心动态。
结论:基础设施奥勒博罗斯现象
OpenAI的六座巨型数据中心计划代表了AI基础设施发展的一个重要转折点。这一庞大投资不仅反映了当前AI服务的需求,也体现了对未来AI发展的雄心。
然而,这种基础设施扩张背后的循环投资模式提出了重要问题。虽然这种模式可能加速创新和基础设施建设,但也创造了复杂的相互依赖关系,可能掩盖潜在的风险和泡沫。
随着AI技术的不断发展,基础设施将继续扮演关键角色。然而,确保这些基础设施的建设与实际需求相匹配,并建立在可持续的经济基础上,将是整个行业面临的长期挑战。只有通过平衡创新与务实,AI基础设施才能真正发挥其潜力,而非成为又一个技术泡沫的象征。