前沿AI透明化:安全、责任与创新共生之路

1

前沿人工智能透明化的必要性:构建安全与创新的平衡点

在人工智能(AI)技术日新月异的今天,尤其是在前沿AI领域,透明化已不再是可选项,而是确保公共安全、强化企业责任的关键要素。正如2025年7月7日发布的报告所强调的,我们需要在AI的快速发展与潜在风险之间找到平衡,构建一个既能促进创新,又能保障社会福祉的框架。

A building with a set of columns

透明化框架的迫切性

随着AI能力的不断增强,其应用范围也日益广泛,从医疗诊断到金融风险评估,再到国家安全,AI的影响无处不在。然而,这种强大的技术也可能带来前所未有的风险,例如,AI系统可能被用于恶意目的,或因设计缺陷导致意外的灾难性后果。因此,在行业、政府、学术界等共同制定统一的安全标准和评估方法的过程中,采取临时的透明化措施至关重要。

报告提出了一项有针对性的透明化框架,旨在适用于联邦、州或国际层面,且仅针对规模最大的AI系统和开发者。该框架的核心是建立清晰的安全实践披露要求,确保AI的开发和应用过程接受公众监督。这种方法避免了过度规范,认识到AI技术的快速演进需要监管的灵活性,既不应阻碍AI创新,也不应减缓AI在拯救生命、提供公共福利和维护国家安全等方面的应用。

AI透明化的最低标准

为了确保AI的健康发展,以下是指导AI透明化政策的核心原则:

  1. 限定适用范围: AI透明化应仅限于构建最强大模型的头部开发者。前沿模型的区分应基于计算能力、计算成本、评估性能、年度收入和研发投入等多重指标。为避免初创企业和小规模开发者因开发对国家安全或造成灾难性危害风险较低的模型而受累,该框架应包含适当的豁免条款。关于这些阈值的具体数值,可以参考年收入1亿美元,或年度研发或资本支出10亿美元作为参考。同时,这些范围界定阈值应根据技术和行业发展定期审查。

  2. 建立安全开发框架: 要求相关的前沿模型开发者建立安全开发框架,详细说明如何评估和降低模型中不合理的风险。这些风险必须包括化学、生物、放射和核危害的产生,以及模型自主性错位造成的危害。由于安全开发框架仍处于发展阶段,任何提案都应力求灵活性。

  3. 公开安全开发框架: 安全开发框架应在AI公司注册并维护的公共网站上公开,但可对敏感信息进行合理的编辑。这将使研究人员、政府和公众能够随时了解当前部署的AI模型。同时,公司应自我证明其遵守已发布的《安全开发框架》的条款。

  4. 发布系统卡: 系统卡或其他文档应概述所需的测试和评估程序、结果和缓解措施(但应适当编辑可能危及公共安全或模型安全性的信息)。系统卡还应在部署时公开披露,并在模型进行重大修改时更新。

  5. 保护举报人,禁止虚假陈述: 明确规定,实验室对其框架的遵守情况撒谎是违法行为。这一明确规定为举报人提供法律保护,并确保执法资源集中于从事有目的不当行为的实验室。

  6. 透明度标准: 一个可行的AI透明度框架应具有一套最低标准,以便在适应AI开发不断变化的性质的同时,加强安全和公共安全。鉴于AI安全实践仍处于早期阶段,像Anthropic这样的前沿开发者正在积极研究最佳实践,任何框架都必须为发展而设计。标准应从灵活、轻量级的要求开始,随着行业、政府和其他利益相关者之间达成共识的最佳实践的出现,这些要求可以进行调整。

透明化框架的益处与挑战

这种透明化方法有助于揭示行业在安全方面的最佳实践,并为负责任的实验室如何训练其模型设定基线,确保开发者达到基本的问责标准,同时使公众和政策制定者能够区分负责任和不负责任的做法。例如,安全开发框架类似于Anthropic的《负责任的扩展政策》以及来自领先实验室(Google DeepMind、OpenAI、Microsoft)的其他政策,所有这些实验室都已在发布前沿模型的同时实施了类似方法。将安全开发框架透明度要求纳入法律不仅可以标准化行业最佳实践,而无需将其固定下来,还可以确保现在是自愿披露的信息将来不会随着模型变得越来越强大而被撤回。

对于AI模型是否以及何时可能构成灾难性风险,各方观点不一。安全开发框架和系统卡的透明度要求可以帮助决策者获得他们所需的证据,以确定是否需要进一步的监管,并向公众提供有关这种强大的新技术的关键信息。

结论

随着模型的进步,我们拥有前所未有的机会来加速科学发现、医疗保健和经济增长。但如果没有安全和负责任的开发,一次灾难性的失败可能会使进展停滞数十年。因此,报告中提出的透明化框架提供了一个切实可行的第一步:在保持私营部门交付AI变革潜力的灵活性的同时,提高安全实践的公共可见性。

总的来说,前沿AI的透明化是构建安全、可信赖的AI生态系统的基石。通过采纳上述原则和标准,我们可以在确保AI技术服务于人类的同时,最大限度地降低其潜在风险,为AI的健康发展奠定坚实的基础。

Paul Smith to join Anthropic as Chief Commercial Officer

Claude for Financial Services

Investing in energy to secure America's AI future