人工智能技术的迅猛发展正在重塑多个领域的传统范式,而蛋白质设计领域正是这一变革的前沿阵地。近期,由微软领导的研究团队的一项发现引发了生物安全领域的广泛关注:他们发现当前用于筛查DNA订购的威胁检测系统可能无法识别由AI设计的新型功能性毒素变体,这一发现相当于生物安全领域的一个"零日漏洞"。本文将深入探讨这一发现背后的科学原理、潜在风险以及应对策略。
生物威胁检测系统的演进与局限
生物威胁形式多样,包括病毒、细菌等病原体,以及蛋白质类毒素(如2003年被寄往白宫的蓖麻毒素)和通过酶促反应产生的化学毒素等。这些威胁的共同起点在于DNA转录为RNA,再翻译为蛋白质的过程。
过去几十年中,获取特定DNA序列变得异常简单,研究人员只需在线订购即可获得合成好的DNA。为应对潜在风险,政府和行业合作建立了DNA序列筛查系统,这些系统会扫描订购的DNA序列,识别可能编码威胁性蛋白质或病毒的部分,并标记可疑订单供人工评估。
筛查技术的持续改进
随着研究的深入,威胁数据库和筛查算法不断更新。早期的筛查基于与目标DNA序列的相似性进行,但由于多种DNA序列可编码相同蛋白质,筛查算法已调整为识别所有构成相同威胁的DNA变体。
然而,新的研究表明,威胁的复杂性远超此范围。不仅多种DNA序列可编码同一蛋白质,多种蛋白质也可执行相同功能。例如,形成毒素通常需要蛋白质采取正确的三维结构,使关键氨基酸处于特定位置。在这些关键氨基酸之外,序列往往具有高度灵活性——某些位置可能对任何氨基酸都适用,其他位置则可能接受任何带正电荷的疏水性氨基酸。
AI蛋白质设计:从科学突破到安全挑战
传统上,确定氨基酸序列变化范围需要大量耗时的实验。但AI蛋白质设计工具的进步使得预测远缘序列能否折叠成相似结构和催化相同反应成为可能。尽管这一过程仍存在误差,需要测试十几种以上设计才能获得功能性蛋白质,但已取得了显著成功。
研究团队的发现
基于这一认识,研究团队提出了一个假设:AI可以设计出与现有毒素功能相同但在序列上足够遥远的蛋白质变体,从而绕过现有筛查系统。他们首先以蓖麻毒素为例,使用AI工具设计其变体,并测试这些变体能否通过DNA订单筛查软件。
测试结果表明,存在功能性蛋白质变体可能绕过现有筛查软件的风险,这一情况被等同于网络安全中的"零日漏洞"。研究团队随后按照网络安全领域的标准流程,联系了相关机构,包括国际基因合成联盟、蛋白质设计社区以及美国科学技术政策办公室、国家标准与技术研究院、国土安全部和流行病准备与应对办公室等。
大规模测试与结果分析
在更广泛的研究中,团队从72种毒素出发,使用三个开源AI工具生成了约75,000种潜在蛋白质变体。由于生物测试所有设计不切实际,研究人员使用两种软件工具评估这些设计:一种关注蛋白质整体预测物理结构的相似性,另一种分析单个氨基酸位置的预测差异。
将这些设计的DNA序列输入四种DNA筛查软件后,结果揭示了显著差异:两种软件表现良好,一种表现中等,另一种则让大多数设计通过。三种软件已根据这些结果进行了更新,显著提高了识别变体的能力。
所有四种筛查软件都显示出共同趋势:变体与原始毒素结构越相似,软件越可能将其标记为威胁。同时,存在一组不太可能折叠成类似结构的变体,这些通常未被标记为威胁。
风险评估:实际威胁与应对策略
值得注意的是,这一评估基于预测结构,"不太可能"折叠成类似结构并不意味着这些蛋白质作为毒素会失去活性。功能性蛋白质在这一组中可能非常罕见,但也可能存在少数有效案例。然而,数量可能少到需要测试过多设计才能找到有效变体,使这种方法实际不可行。
另一方面,存在一些与毒素结构非常相似但未被软件标记的蛋白质。对于三种更新后的软件,在"非常相似"类别中,约有1-3%的变体未被标记。虽然不够理想,但可能足够安全——任何试图通过这种方法订购毒素的团体可能需要订购50多个才能找到一个绕过筛查的变体,这会引起高度警惕。
威胁的集中性与特殊性
未被标记的设计主要集中在少数几种毒素蛋白的变体上,这表明问题可能不是筛查软件的普遍缺陷,而是一小部分特定问题。值得注意的是,一种产生大量未标记变体的蛋白质本身并非毒素,而是实际毒素所需的辅助因子。因此,一些筛查软件甚至没有将原始蛋白质标记为危险,更不用说其变体。
未来展望:技术发展与安全平衡
这项研究本身并未立即构成重大威胁,但其价值在于促使筛查软件开发人员开始思考新兴威胁。AI蛋白质设计仍处于早期阶段,未来可能取得显著进步。同时,我们可能面临筛查能力的极限。
目前,AI蛋白质设计工具已可用于创建具有全新功能的蛋白质,且无需从现有蛋白质变体出发。这意味着我们可以设计出基于与已知威胁相似性无法筛查的蛋白质,因为它们与任何已知危险物质都不相似。
蛋白质类毒素特别难以设计,因为它们必须穿过细胞膜并在内部造成危害。虽然AI工具目前可能无法设计出如此复杂的蛋白质,但不应排除它们最终达到这种复杂性的可能性。
结论:科技发展与安全边界的重新思考
AI设计蛋白质的发现提醒我们,科技发展与安全边界需要不断重新评估。这一发现不仅关乎生物安全,更反映了技术进步与安全防护之间永恒的博弈。随着AI在生物设计领域的深入应用,我们需要建立更灵活、更前瞻性的安全框架,平衡创新与风险。
研究团队的做法值得肯定——他们没有隐瞒发现,而是主动与相关机构合作,共同应对这一潜在威胁。这种负责任的研究态度为科技伦理树立了典范,也为我们如何在享受科技红利的同时确保安全提供了重要启示。
未来,我们需要持续关注AI在生物设计领域的进展,不断更新威胁检测技术,同时加强国际合作,共同构建应对生物安全挑战的全球治理体系。只有这样,我们才能确保科技真正造福人类,而非成为新的威胁源。