OpenAI近期与Oracle和软银共同宣布了一项令人瞠目结舌的计划:在未来三年内投资超过4000亿美元,在美国建设五座新的AI数据中心。这一举措将Stargate平台的规划容量提升至近7吉瓦,引发了业界对AI基础设施需求的广泛讨论。
六座数据中心的扩张计划
周二,OpenAI、Oracle和软银共同宣布了为Stargate项目——他们的联合AI基础设施项目——建设五座美国新AI数据中心的计划。这些数据中心将使平台总规划容量达到近7吉瓦,并在未来三年内获得超过4000亿美元的投资。
这一大规模扩建旨在应对ChatGPT每周7亿用户的需求,并训练未来的AI模型。尽管批评人士质疑这种投资结构是否可持续,但这些公司表示,这一扩张使他们有望在2025年底前确保他们今年1月宣布的5000亿美元、10吉瓦的完整承诺。
五座新数据中心将包括三个通过OpenAI和Oracle合作伙伴关系开发的位置:德克萨斯州的谢尔克福德县、新墨西哥州的唐娜安娜县以及一个未公开的中西部地点。这些站点加上德克萨斯州阿比林旗舰Stargate站点附近600兆瓦的扩建,可提供超过5.5吉瓦的容量,这意味着当站点计算机满负荷运行时,能够消耗高达55亿瓦的电力。这些公司预计这些站点将创造超过25,000个现场工作岗位。
另外两个站点将通过软银和OpenAI之间的合作伙伴关系开发。俄亥俄州洛兹敦的一个站点已经破土动工,有望在明年投入运营。德克萨斯州米拉姆县的第二个站点将与软银集团旗下的SB Energy公司共同开发。这两个站点在未来18个月内可能扩展到1.5吉瓦。
新站点将与德克萨斯州阿比林的旗舰Stargate校园合并。Oracle已于6月开始向该站点交付Nvidia硬件,OpenAI已开始使用该数据中心进行训练(构建新模型)和推理(运行ChatGPT)。
以下是迄今为止宣布的Stargate站点概览:
- 阿比林,德克萨斯州:旗舰校园,已配备Nvidia GB200机架,另有计划中的600兆瓦扩建
- 谢尔克福德县,德克萨斯州:新的Oracle开发站点
- 唐娜安娜县,新墨西哥州:新的Oracle开发站点
- 中西部地点(未公开):新的Oracle开发站点
- 洛兹敦,俄亥俄州:新的软银开发站点,明年投入运营
- 米拉姆县,德克萨斯州:新的软银/SB能源站点
OpenAI和Oracle在7月达成协议,开发多达4.5吉瓦的额外Stargate容量,这代表了两家公司五年内价值超过3000亿美元的合作伙伴关系。这些公司表示,他们在今年1月发起的全美流程中审查了来自30多个州的300多项提案后,选择了这五个新站点。
OpenAI为何需要巨大计算能力
OpenAI及其合作伙伴提出的数字——10吉瓦、5000亿美元——对于不熟悉互联网基础设施规模的普通人来说,规模令人难以置信且令人费解。例如,10吉瓦相当于大约10座核电站的发电量,足以为数百万家庭供电。但OpenAI真的需要这些数据中心做什么呢?这一切都源于OpenAI首席执行官Sam Altman为数十亿人提供智能即服务的梦想。
"AI只有在我们构建为其提供动力的计算能力时才能实现其承诺,"OpenAI首席执行官Sam Altman在公告中说。"这种计算能力是确保每个人都能从AI中受益并解锁未来突破的关键。"
Altman的声明反映了他对未来AI系统有用性的乐观态度,但尽管存在AI泡沫警告和对底层技术的批评,目前生成式AI容量仍有未满足的实际需求。ChatGPT拥有7亿周活跃用户,超过美国人口的两倍,他们经常使用AI助手开发软件、提供个人建议以及撰写或编辑信件和报告。虽然输出有时可能不完美,但人们显然仍然需要它们。
OpenAI经常面临严重的容量限制来产生这些输出,这导致对其用户可以查询聊天机器人的频率的限制。ChatGPT Plus订阅用户经常遇到这些使用限制,特别是在使用像图像生成或模拟推理模型这样计算密集型功能时。代表未来订阅入口的免费用户面临更严格的限制。OpenAI缺乏满足当前需求的计算能力,更不用说为未来增长留出空间了。
训练下一代AI模型加剧了这一问题。除了运行为ChatGPT提供动力的现有AI模型外,OpenAI还在后台不断开发新技术。这是一个需要数千个专用芯片连续运行数月的过程。
循环投资的问题
OpenAI、Oracle和Nvidia之间交易的财务结构引起了行业观察家的密切关注。本周早些时候,Nvidia宣布在OpenAI部署Nvidia系统时将投资高达1000亿美元。正如Requisite Capital Management的Bryn Talkington告诉CNBC的那样:"Nvidia向OpenAI投资1000亿美元,然后OpenAI又将其返还给Nvidia。"
Oracle的安排遵循了类似的模式,据报道是一项每年300亿美元的协议,Oracle建设OpenAI付费使用的设施。这种涉及基础设施提供商投资于AI公司的循环流动,而这些AI公司又成为他们最大的客户,引发了人们对这些代表真正的经济投资还是精心策划的会计操作的质疑。
这些安排正变得日益复杂。《信息》本周报道,Nvidia正在讨论向OpenAI租赁其芯片,而不是直接出售。在这种结构下,Nvidia将创建一个单独实体来购买自己的GPU,然后将其租赁给OpenAI,这为这种复杂的关系又增加了一层循环财务工程。
"Nvidia为这些公司提供种子资金,并给予他们必要的保证合同,以筹集债务购买Nvidia的GPU,即使这些公司严重亏损,并最终因缺乏任何真实需求而倒闭,"科技评论家Ed Zitron上周在Bluesky上关于AI基础设施投资的异常流动写道。Zitron指的是CoreWeave和Lambda Labs等公司,这些公司已筹集数十亿美元债务购买Nvidia GPU,部分基于Nvidia自身的合同。这种模式反映了OpenAI与Oracle和Nvidia的安排。
那么,如果泡沫破裂会怎样?即使是Altman本人在上个月也警告说,在他所称的AI泡沫中,"有人将损失巨额金钱"。如果AI需求无法满足这些天文数字般的预测,建立在物理土壤上的大型数据中心不会 simply 消失。当2001年互联网泡沫破裂时,在繁荣时期铺设的光纤电缆最终随着互联网需求的增长而找到了用途。同样,这些设施可能会转向云服务、科学计算或其他工作负载,但可能会给那些支付AI繁荣价格的投资者带来巨大损失。
数据中心选址的战略考量
OpenAI及其合作伙伴选择特定位置建设数据中心并非偶然。这些选址决策背后有着深思熟虑的战略考量,包括能源可用性、网络连接、税收优惠和人才储备等因素。
德克萨斯州在Stargate计划中占据了重要地位,拥有阿比林、谢尔克福德县和米拉姆县三个站点。该州丰富的能源资源、相对较低的电力成本以及友好的商业环境使其成为AI数据中心的理想选址。新墨西哥州的唐娜安娜县则可能受益于该州在可再生能源方面的投资和税收激励政策。
俄亥俄州的洛兹敦站点选择则反映了软银在该地区的现有投资和产业布局。中西部未公开的选址可能是基于该地区在数据中心基础设施方面的潜力和成本优势。
这些选址决策不仅考虑了当前需求,还着眼于未来发展。随着AI模型规模的不断扩大,对能源的需求将持续增长,因此选址时必须考虑长期能源供应的稳定性和可持续性。
数据中心对AI发展的意义
这些巨型数据中心的建设不仅仅是应对当前需求的临时措施,更是AI技术发展的基础设施保障。AI模型的训练和推理需要巨大的计算资源,而数据中心的规模和效率直接决定了AI技术的发展速度和方向。
随着AI模型参数数量的指数级增长,从GPT-3的1750亿参数到未来可能达到的万亿参数级别,对计算资源的需求将呈几何级数增长。没有足够的数据中心容量,AI研究的进展将受到严重制约。
此外,数据中心的分布也影响着AI服务的全球可用性和响应速度。通过在多个地理位置建设数据中心,OpenAI可以为其全球用户提供更低的延迟和更可靠的服务体验。
数据中心建设的经济影响
这些巨型数据中心的建设将对当地经济产生深远影响。每个站点预计创造数千个就业机会,从建筑工人到数据中心运营工程师,从IT支持人员到安全专家。
此外,数据中心建设还将带动相关产业的发展,包括电力供应、网络基础设施、冷却系统、硬件制造等。这些产业的增长将进一步促进当地经济的多元化和发展。
然而,这种经济影响也带来了挑战。数据中心的高能耗可能导致当地电力供应紧张,需要升级电网基础设施。同时,数据中心建设可能对当地水资源造成压力,特别是在干旱地区,因为数据中心需要大量的水来冷却设备。
数据中心技术的创新趋势
为了应对AI计算需求的爆炸性增长,数据中心技术也在不断创新。从液冷技术到更高效的电源管理,从模块化设计到AI优化的网络架构,这些技术创新正在推动数据中心向更高效、更可持续的方向发展。
液冷技术相比传统的风冷技术可以更有效地散热,使数据中心能够在更高功率密度下运行,从而在相同空间内容纳更多的计算设备。这对于空间有限但需要大量计算资源的数据中心尤为重要。
电源管理技术的进步则有助于提高数据中心的能源效率,减少能源浪费。通过智能化的电源分配和管理,可以确保计算资源得到最有效的利用,同时降低运营成本。
数据中心与可持续发展的平衡
AI数据中心的高能耗引发了对其环境影响的担忧。一座7吉瓦的数据中心每年消耗的电力相当于一个小型城市。如何在满足AI计算需求的同时实现可持续发展,成为行业面临的重要挑战。
OpenAI及其合作伙伴正在探索多种途径来降低数据中心的碳足迹。包括使用可再生能源、提高能源效率、投资碳捕获技术等。此外,一些公司还在研究如何利用废热,例如为附近社区提供供暖或用于农业温室。
然而,这些解决方案仍面临技术和经济上的挑战。可再生能源的间歇性使其难以满足数据中心对稳定电力的需求,而碳捕获技术目前成本高昂且规模有限。如何在短期内实现数据中心的大规模脱碳,仍是一个待解决的问题。
数据中心安全的挑战
随着AI数据中心规模的扩大和重要性的提升,其安全性也面临新的挑战。这些数据中心存储着敏感的训练数据,运行着关键的AI模型,成为潜在攻击者的目标。
物理安全方面,需要防止未经授权的人员进入数据中心设施,保护服务器和网络设备免受物理损害。网络安全方面,则需要防范黑客攻击、数据泄露和分布式拒绝服务(DDoS)攻击等威胁。
此外,AI模型本身的安全也不容忽视。对抗性攻击可能导致AI模型产生错误或有害的输出,而模型窃取则可能导致知识产权泄露。因此,数据中心需要实施全面的安全措施,包括物理安全、网络安全和AI安全等多个层面。
数据中心与AI伦理的交织
AI数据中心不仅是技术基础设施,也是AI伦理实践的重要场所。数据中心的运营方式直接影响AI系统的公平性、透明度和问责制。
首先,数据中心的能源消耗和环境影响反映了AI技术的可持续性伦理。如果AI发展以牺牲环境为代价,那么其社会价值将受到质疑。因此,数据中心在选址和运营时需要考虑环境因素,采用绿色能源和节能技术。
其次,数据中心的数据处理方式涉及隐私和数据保护伦理。AI训练通常需要大量数据,这些数据可能包含个人信息。数据中心需要确保数据处理的合法性和合规性,保护用户隐私。
最后,数据中心的资源分配也反映了AI的公平性伦理。计算资源的分配是否公平,将影响不同群体获取AI服务的能力。数据中心需要确保资源的公平分配,避免数字鸿沟的扩大。
数据中心与AI监管的关系
随着AI技术的发展,各国政府正在加强对AI的监管。数据中心作为AI基础设施的重要组成部分,也受到监管机构的关注。
数据中心的选址和建设需要符合当地的法律法规,包括土地使用、环境评估、建筑许可等方面的要求。此外,数据中心的数据处理和存储也需要遵守数据保护法规,如欧盟的GDPR或美国的CCPA等。
随着AI监管框架的不断完善,数据中心可能需要满足更多的合规要求。例如,某些高风险AI应用可能要求使用特定的数据中心设施,或者实施数据本地化措施。这些监管要求将影响数据中心的运营模式和成本结构。
数据中心与AI创新的互动
数据中心不仅是AI技术的基础设施,也是推动AI创新的重要力量。数据中心的规模和效率直接影响AI模型训练的速度和成本,进而影响AI研究的进展。
更强大的数据中心可以支持更大规模的AI模型训练,使研究人员能够探索更复杂的AI架构和算法。同时,更高效的数据中心可以降低训练成本,使更多研究机构和初创公司能够参与AI研究,促进创新生态的多元化。
此外,数据中心的分布式特性也为AI创新提供了新的可能性。通过在多个地理位置部署数据中心,可以实现模型的分布式训练和推理,提高系统的容错性和可扩展性。这种分布式架构支持了联邦学习、边缘计算等新兴AI技术的发展。
数据中心与AI商业化的关系
AI数据中心的建设与AI技术的商业化密切相关。一方面,AI应用的商业化需求推动了数据中心的建设和扩张;另一方面,数据中心的规模和效率也影响AI产品的市场竞争力和盈利能力。
对于OpenAI等AI公司而言,拥有充足的数据中心容量意味着可以提供更稳定、更快速的服务,从而吸引更多用户和客户。同时,高效的数据中心运营可以降低服务成本,提高利润率,增强公司的市场竞争力。
对于数据中心提供商而言,与AI公司的合作带来了稳定的收入来源和长期的投资回报。然而,这也意味着需要持续投资于基础设施升级和技术创新,以满足AI计算需求不断增长的要求。
数据中心与AI人才培养的关系
AI数据中心的建设和运营需要大量专业人才,从数据中心工程师到AI研究员,从硬件专家到软件开发者。这种人才需求推动了AI教育和培训的发展。
为了满足数据中心对人才的需求,高校和职业培训机构正在开设更多与数据中心和AI相关的课程和项目。同时,数据中心企业也积极参与人才培养,提供实习机会和在职培训,帮助员工掌握最新的技术和技能。
此外,数据中心的分布也影响AI人才的地理分布。数据中心集群地区通常也会形成AI人才聚集区,促进产学研合作和创新生态的形成。
数据中心与AI全球化的关系
AI数据中心的建设反映了AI技术的全球化趋势。OpenAI及其合作伙伴在美国多个州建设数据中心,体现了AI基础设施的本地化布局,同时也反映了全球AI竞争的加剧。
不同国家和地区都在积极投资AI数据中心,以增强自身的AI竞争力和技术主权。例如,欧盟推出了"欧洲处理器计划"(EPI),旨在开发欧洲自己的AI芯片和数据中心技术;中国也在大力发展AI基础设施,支持本土AI产业的发展。
AI数据中心的全球化布局也带来了新的挑战,包括数据跨境流动、技术标准统一、安全合作等问题。如何在全球化背景下实现AI基础设施的互联互通和协同发展,成为国际社会需要共同面对的课题。
数据中心与AI未来发展的关系
AI数据中心的建设不仅是为了应对当前的需求,更是为了支持AI技术的未来发展。随着AI技术的不断进步,对计算资源的需求将持续增长,数据中心的重要性也将进一步提升。
未来的AI数据中心可能会更加智能化和自动化,利用AI技术优化自身的运营和管理。例如,通过AI算法预测和优化能源消耗,通过自动化技术提高运维效率,通过智能监控系统增强安全性等。
此外,未来的数据中心可能会更加注重可持续性和社会责任,采用更多绿色能源和环保技术,减少对环境的影响,同时为当地社区创造更多价值。
数据中心与AI技术融合的趋势
AI技术与数据中心技术的融合正在加速。一方面,AI技术被应用于数据中心的优化和管理,提高效率和可靠性;另一方面,数据中心的发展也为AI技术的进步提供了基础设施支持。
在数据中心管理中,AI技术被用于预测性维护、负载均衡、能源管理、安全监控等方面。通过分析大量运行数据,AI算法可以预测设备故障,优化资源分配,提高数据中心的整体性能和可靠性。
同时,数据中心的发展也为AI技术的进步提供了必要的计算支持。随着数据中心规模的扩大和性能的提升,AI模型可以训练得更快、更大,从而推动AI技术的不断创新和突破。
数据中心与AI产业生态的关系
AI数据中心的建设和发展离不开整个产业生态的支持。从芯片制造商到软件开发商,从能源供应商到网络服务提供商,各个环节的协同合作是数据中心成功运营的关键。
在AI数据中心的生态系统中,Nvidia等芯片制造商提供高性能计算硬件,Oracle等云服务提供商提供基础设施和服务,OpenAI等AI公司开发应用和模型,能源供应商提供稳定的电力供应,网络服务提供商提供高速连接。这些参与者共同构成了一个完整的产业生态,推动AI技术的创新和应用。
产业生态的健康和发展也直接影响数据中心的建设和运营。一个开放、创新、协作的产业生态可以促进技术的快速迭代和应用的创新,为数据中心的发展提供持续的动力和支持。
数据中心与AI社会影响的关系
AI数据中心的建设和发展对社会产生深远影响。一方面,AI技术通过数据中心的应用,可以改善医疗服务、优化交通系统、提高能源效率等,为社会创造巨大价值;另一方面,AI技术的广泛应用也可能带来就业结构变化、隐私安全风险、算法偏见等问题。
AI数据中心的建设创造了大量就业机会,促进了相关产业的发展,带动了地方经济的增长。同时,AI技术的应用可以提高生产效率,创造新的商业模式和就业机会,推动经济社会的数字化转型。
然而,AI技术的广泛应用也可能导致某些传统工作岗位的消失,加剧就业市场的结构性变化。此外,AI系统的决策可能存在偏见,侵犯隐私安全,甚至被用于恶意目的。这些问题需要社会各界共同关注和解决,确保AI技术的发展符合社会利益和伦理标准。
数据中心与AI技术标准的关系
随着AI数据中心的规模和复杂性不断增加,技术标准的统一和规范变得尤为重要。标准可以确保不同厂商的设备和系统互操作,提高数据中心的兼容性和可扩展性。
在AI数据中心领域,需要建立统一的技术标准,包括硬件接口、网络协议、能源管理、安全要求等方面。这些标准可以降低数据中心的建设和运营成本,提高系统的可靠性和安全性,促进产业的健康发展。
此外,随着AI技术的快速发展,还需要不断更新和完善相关标准,以适应新的技术需求和应用场景。标准的制定需要产业界、学术界和政府部门的共同参与和协作,确保标准的科学性和实用性。
数据中心与AI技术伦理的关系
AI数据中心的运营涉及诸多伦理问题,包括能源消耗、环境影响、数据隐私、算法公平性等。这些问题需要在数据中心的设计和运营过程中得到充分考虑和妥善处理。
在能源消耗和环境影响方面,数据中心应采用绿色能源和节能技术,减少碳足迹,降低对环境的影响。在数据隐私方面,数据中心应确保数据处理的合法性和合规性,保护用户隐私,防止数据泄露和滥用。
在算法公平性方面,数据中心应关注AI模型的训练数据质量和多样性,避免算法偏见和歧视。同时,应建立透明的AI决策机制,提高系统的可解释性和问责制,确保AI技术的公平和公正。
数据中心与AI技术安全的关系
AI数据中心的安全问题日益凸显,包括物理安全、网络安全、数据安全和AI安全等多个层面。这些安全问题需要全面考虑和系统解决,确保数据中心的安全稳定运行。
在物理安全方面,数据中心应采取严格的访问控制措施,防止未经授权的人员进入设施,保护服务器和网络设备免受物理损害。在网络安全方面,应建立完善的安全防护体系,防范黑客攻击、数据泄露和DDoS攻击等威胁。
在数据安全方面,应实施数据加密、访问控制、审计追踪等措施,保护数据在存储和传输过程中的安全。在AI安全方面,应关注模型的安全性和可靠性,防止对抗性攻击和模型窃取,确保AI系统的安全和可信。
数据中心与AI技术可持续性的关系
AI数据中心的可持续发展是当前面临的重要挑战。随着AI计算需求的不断增长,数据中心的能源消耗和环境压力也在增加,如何在满足需求的同时实现可持续发展成为关键问题。
为了实现数据中心的可持续发展,需要采取多种措施,包括使用可再生能源、提高能源效率、优化资源利用、减少废物产生等。此外,还可以探索数据中心与周边产业的协同发展,例如利用废热为社区供暖或用于农业温室。
同时,数据中心的可持续发展也需要政策支持和行业合作。政府可以出台激励政策,鼓励企业采用绿色能源和节能技术;行业组织可以推动最佳实践的分享和推广,促进整个行业的可持续发展。
数据中心与AI技术创新的关系
AI数据中心是技术创新的重要平台,推动着AI技术的不断进步。数据中心的规模和效率直接影响AI模型训练的速度和成本,进而影响AI研究的进展和创新的速度。
更强大的数据中心可以支持更大规模的AI模型训练,使研究人员能够探索更复杂的AI架构和算法。同时,更高效的数据中心可以降低训练成本,使更多研究机构和初创公司能够参与AI研究,促进创新生态的多元化。
此外,数据中心的分布式特性也为AI创新提供了新的可能性。通过在多个地理位置部署数据中心,可以实现模型的分布式训练和推理,提高系统的容错性和可扩展性。这种分布式架构支持了联邦学习、边缘计算等新兴AI技术的发展。
数据中心与AI技术商业化的关系
AI数据中心的建设与AI技术的商业化密切相关。一方面,AI应用的商业化需求推动了数据中心的建设和扩张;另一方面,数据中心的规模和效率也影响AI产品的市场竞争力和盈利能力。
对于OpenAI等AI公司而言,拥有充足的数据中心容量意味着可以提供更稳定、更快速的服务,从而吸引更多用户和客户。同时,高效的数据中心运营可以降低服务成本,提高利润率,增强公司的市场竞争力。
对于数据中心提供商而言,与AI公司的合作带来了稳定的收入来源和长期的投资回报。然而,这也意味着需要持续投资于基础设施升级和技术创新,以满足AI计算需求不断增长的要求。
数据中心与AI人才培养的关系
AI数据中心的建设和运营需要大量专业人才,从数据中心工程师到AI研究员,从硬件专家到软件开发者。这种人才需求推动了AI教育和培训的发展。
为了满足数据中心对人才的需求,高校和职业培训机构正在开设更多与数据中心和AI相关的课程和项目。同时,数据中心企业也积极参与人才培养,提供实习机会和在职培训,帮助员工掌握最新的技术和技能。
此外,数据中心的分布也影响AI人才的地理分布。数据中心集群地区通常也会形成AI人才聚集区,促进产学研合作和创新生态的形成。
数据中心与AI全球化的关系
AI数据中心的建设反映了AI技术的全球化趋势。OpenAI及其合作伙伴在美国多个州建设数据中心,体现了AI基础设施的本地化布局,同时也反映了全球AI竞争的加剧。
不同国家和地区都在积极投资AI数据中心,以增强自身的AI竞争力和技术主权。例如,欧盟推出了"欧洲处理器计划"(EPI),旨在开发欧洲自己的AI芯片和数据中心技术;中国也在大力发展AI基础设施,支持本土AI产业的发展。
AI数据中心的全球化布局也带来了新的挑战,包括数据跨境流动、技术标准统一、安全合作等问题。如何在全球化背景下实现AI基础设施的互联互通和协同发展,成为国际社会需要共同面对的课题。
数据中心与AI未来发展的关系
AI数据中心的建设不仅是为了应对当前的需求,更是为了支持AI技术的未来发展。随着AI技术的不断进步,对计算资源的需求将持续增长,数据中心的重要性也将进一步提升。
未来的AI数据中心可能会更加智能化和自动化,利用AI技术优化自身的运营和管理。例如,通过AI算法预测和优化能源消耗,通过自动化技术提高运维效率,通过智能监控系统增强安全性等。
此外,未来的数据中心可能会更加注重可持续性和社会责任,采用更多绿色能源和环保技术,减少对环境的影响,同时为当地社区创造更多价值。