AI设计的蛋白质:生物安全领域的隐形威胁

1

在人工智能技术飞速发展的今天,一个令人担忧的生物安全隐患悄然浮现:现有的DNA序列筛查工具可能无法识别AI设计的危险蛋白质。微软研究团队最新发现,AI可以创造出功能相同但结构迥异的蛋白质变体,这些变体可能绕过现有的生物威胁筛查系统。这一发现被称为'生物零日漏洞',引发了科学界对生物安全防护体系的重新思考。

生物威胁筛查系统的局限性

生物威胁形式多样,包括病毒、细菌等病原体,以及蓖麻毒素等蛋白质类毒素,还有通过酶促反应产生的化学毒素。这些威胁的共同起点是DNA转录为RNA,再翻译为蛋白质的过程。过去几十年中,获取特定DNA序列变得异常简单,只需在线订购即可。为防范潜在威胁,政府和行业合作建立了DNA序列筛查系统,检查订购的DNA是否编码已知危险蛋白质或病毒。

蛋白质结构模型

AI设计工具使复杂的蛋白质三维结构设计变得更加容易

然而,随着技术的进步,这一系统的局限性日益显现。最初的筛查基于与目标DNA序列的相似性,但许多不同的DNA序列可以编码相同的蛋白质。因此,筛查算法不断更新,以识别所有构成相同威胁的DNA变体。

AI设计带来的新挑战

蛋白质的功能取决于其三维结构,特别是关键氨基酸残基的空间排列。在关键区域之外,蛋白质序列往往具有较大的灵活性。过去,确定氨基酸序列变化的耐受性需要耗时耗力的实验,但现在,AI蛋白质设计工具已能预测远缘序列如何折叠成相似结构和催化相同反应。

研究团队提出了一个假设:AI可以基于现有毒素设计出功能相同但结构差异足够大的蛋白质变体,使现有筛查程序无法检测到编码这些蛋白质的DNA订单。

零日漏洞的发现与应对

研究团队首先进行了基础测试:使用AI工具设计蓖麻毒素的变体,然后测试用于筛查DNA订单的软件。结果表明,存在危险蛋白质变体绕过现有筛查软件的风险,因此该情况被视为零日漏洞。

"借鉴网络安全领域处理此类情况的成熟流程,我们联系了相关机构,包括国际基因合成联盟、蛋白质设计领域的可信同事以及美国科学技术政策办公室、美国国家标准与技术研究院、美国国土安全部和美国大流行病准备与应对办公室的生物安全负责人。"研究团队报告道。

蛋白质折叠示意图

AI设计的蛋白质变体可能具有与原始毒素相同的功能但结构差异显著

研究团队从72种毒素开始,使用三个开源AI包生成了约75,000个潜在蛋白质变体。由于测试所有这些设计的生物活性不现实,研究人员使用两种软件工具评估每个设计:一种关注蛋白质整体预测物理结构的相似性,另一种检查单个氨基酸位置预测的差异。

筛查软件的性能差异

测试结果揭示了四种筛查程序在识别这些变体设计作为威胁方面的巨大差异:两个程序表现良好,一个表现中等,另一个让大多数变体通过。三个软件包已根据这一性能进行了更新,显著提高了识别变体的能力。

所有四个筛查程序都显示出明显的趋势:变体与原始结构越相似,程序(修补前后)就越有可能将其标记为威胁。在所有情况下,都有一组不太可能折叠成类似结构的变体设计,这些通常未被标记为威胁。

风险评估与实际影响

需要强调的是,这一评估基于预测结构;'不太可能'折叠成类似结构并不意味着这些蛋白质作为毒素会失去活性。功能性蛋白质在这组设计中可能非常罕见,但可能存在少数几个。然而,这些功能性蛋白质可能足够稀有,以至于需要测试大量设计才能找到有效的,这使得这种威胁向量不切实际。

同时,也有一些蛋白质在结构上与毒素非常相似且未被软件标记。对于三个修补后的软件版本,在'非常相似'类别中,绕过筛查的约占1%到3%。虽然不够理想,但可能足够好,以至于任何通过此方法尝试订购毒素的团体都会引起注意,因为他们需要订购50多个才有很大机会找到一个绕过筛查的,这会引发各种警报。

值得注意的是,未被标记的设计主要是少数几种蛋白质毒素的变体。因此,这更像是筛查软件的一组小问题,而非普遍问题。其中一个产生大量未标记变体的蛋白质本身并不具有毒性,而是实际毒素发挥作用的必需辅因子。因此,一些筛查软件甚至没有将原始蛋白质标记为危险,更不用说其任何变体。

未来展望与应对策略

从目前来看,这项研究并未识别出构成重大威胁的问题。然而,它是有价值的,因为它促使筛查软件工程师开始思考新兴威胁。

正如这项研究背后的团队所指出的,AI蛋白质设计仍处于早期阶段,我们可能会看到显著的改进。同时,我们能够筛查的内容可能存在局限性。我们已达到AI蛋白质设计工具可以创建具有全新功能的蛋白质的阶段,而且无需从现有蛋白质变体开始。换句话说,我们可以设计出基于与已知威胁的相似性无法筛查的蛋白质,因为它们看起来一点也不像我们所知道的危险物质。

蛋白质类毒素将非常难以设计,因为它们必须穿过细胞膜并在内部做一些危险的事情。虽然目前的AI工具可能无法设计出如此复杂的东西,但我不会排除它们最终达到这种复杂性的可能性。

结论与建议

这一发现提醒我们,随着AI技术在生物领域的应用不断深入,生物安全防护体系需要不断更新和完善。建议采取以下措施:

  1. 加强AI蛋白质设计的监管:建立针对AI设计蛋白质的专门审查机制,重点关注其潜在生物危害性。

  2. 提升筛查算法的适应性:开发能够识别蛋白质功能而非仅关注序列相似性的新型筛查算法。

  3. 促进国际合作:建立全球性的生物安全信息共享平台,共同应对新兴生物威胁。

  4. 平衡创新与安全:在鼓励生物技术创新的同时,确保安全防护措施同步发展,避免出现防护真空。

随着AI技术的不断进步,生物安全领域将面临更多挑战。只有通过持续的研究、国际合作和负责任的创新,我们才能在享受技术带来便利的同时,有效防范潜在的生物风险。