AI蛋白质设计:生物安全领域的未知漏洞

0

在科技飞速发展的今天,人工智能正以前所未有的速度重塑各个领域。蛋白质设计,这一曾经耗时耗力的科学难题,如今在AI工具的辅助下变得轻而易举。然而,这一技术突破也带来了意想不到的安全隐患——微软研究团队近期发现,现有生物威胁筛查系统可能存在一个'生物0day漏洞',无法有效识别AI设计的毒素蛋白。这一发现不仅挑战了我们对生物安全的认知,更引发了对技术发展与安全防护平衡的深思。

生物威胁筛查系统的演进

生物威胁形式多样,既包括病毒、细菌等病原体,也包括蓖麻毒素这类蛋白质毒素,以及通过酶促反应产生的化学毒素。无论形式如何,这些威胁都遵循一个基本生物学过程:DNA转录为RNA,进而合成蛋白质。过去几十年,科学家只需在线订购所需DNA序列,生物公司即可合成并配送。然而,这一便捷流程也潜藏着安全风险。

为应对潜在威胁,政府和产业界合作建立了DNA序列筛查机制。每个DNA订单都会经过扫描,检查其是否能编码被视为威胁的蛋白质或病毒片段。任何阳性结果都会标记出来,供人工评估是否构成实际危险。多年来,蛋白质清单和筛查算法不断更新,以应对科研进展。例如,初期筛查基于与目标DNA序列的相似性,但认识到多种DNA序列可编码同一蛋白质后,算法相应调整,能识别所有构成相同威胁的DNA变体。

AI技术带来的新挑战

传统筛查系统主要关注DNA序列与已知威胁的相似性,却忽略了蛋白质功能的多样性。研究表明,多种蛋白质可执行相同功能,毒素的形成通常需要蛋白质采取正确的三维结构,使关键氨基酸处于适当位置。在这些关键氨基酸之外,蛋白质结构往往具有灵活性——某些氨基酸位置可能不重要,其他位置则可接受多种类型氨基酸。

过去,确定氨基酸序列变化对蛋白质功能的影响需要大量耗时耗力的实验。但AI蛋白质设计工具的进步使情况发生改变。这些工具能够预测远缘序列是否能折叠成相同形状并催化相同反应。虽然过程仍有误差,通常需要测试十多个设计方案才能获得一个功能性蛋白质,但已取得显著成功。

基于这一认识,研究团队提出假设:AI可设计出功能相同但结构足够独特的毒素变体,使现有筛查程序无法检测到编码这些蛋白质的DNA订单。

验证与发现

为验证这一假设,团队首先进行了基本测试:使用AI工具设计蓖麻毒素变体,然后测试它们对抗DNA订单筛查软件。结果显示,危险蛋白质变体确实可能绕过现有筛查软件,这一情况被类比为0day漏洞。

研究团队随后进行了大规模分析,从72种毒素出发,使用三个开源AI软件包生成了约75,000个潜在蛋白质变体设计。由于实际测试所有设计不现实,研究人员使用两种软件工具评估每个设计:一种关注蛋白质整体预测物理结构的相似性,另一种检查单个氨基酸位置的预测差异。

将这些DNA序列输入四种DNA订单筛查软件后,结果令人警醒:不同软件检测威胁变体的能力差异巨大。其中两个表现良好,一个表现中等,另一个则让大多数变体通过。三种软件包根据这一结果进行了更新,显著提高了检测变体的能力。

所有四款筛查软件都显示出明显趋势:变体与原始毒素结构越相似,软件就越有可能将其标记为威胁。同时,也存在一组可能无法折叠成类似结构的变体设计,这些通常未被标记为威胁。

风险评估与应对

需要强调的是,这一评估基于预测结构;'不太可能'折叠成类似结构并不意味着这些蛋白质作为毒素会失活。功能性蛋白质在这一组中可能非常罕见,但可能存在少数几例。然而,这些功能性蛋白质可能足够稀少,以至于需要测试过多设计才能找到有效 ones,使这一威胁向量不切实际。

同时,也存在一些与毒素结构非常相似但未被软件标记的蛋白质。对于三个更新后的软件版本,在'非常相似'类别中,约有1%到3%的变体未被标记。虽然不理想,但可能足够好——任何试图通过此方法订购毒素的团体将因需要订购50多个才能有较高机会找到一个绕过检测的变体而引起注意。

值得注意的是,未被标记的设计主要是少数几种毒素蛋白的变体。因此,这更像是筛查软件的一组小而集中的问题,而非普遍问题。其中一个产生大量未标记变体的蛋白质本身并非毒素,而是实际毒素发挥作用所需的辅因子。一些筛查软件甚至没有标记原始蛋白质为危险,更不用说其变体。

未来展望与安全启示

尽管当前研究未发现构成重大威胁的漏洞,但这一发现仍然具有重要价值。它促使筛查软件开发人员开始思考新兴威胁,而AI蛋白质设计仍处于早期阶段,未来可能有显著改进。同时,我们能够筛查的内容可能存在极限。

我们已经到达这样一个阶段:AI蛋白质设计工具可创造具有全新功能的蛋白质,且无需从现有蛋白质变体开始。换句话说,我们可以设计出基于与已知威胁相似性无法筛查的蛋白质,因为它们与任何已知危险物都不相似。

蛋白质毒素将非常难以设计,因为它们必须穿过细胞膜并在内部执行危险功能。虽然当前AI工具可能无法设计如此复杂的东西,但我不敢断言它们最终不会达到这种复杂度。

这一发现提醒我们,技术进步与安全防护之间需要持续平衡。生物安全领域必须保持警惕,不仅应对当前威胁,还要预见未来可能出现的挑战。正如网络安全领域不断更新防御措施以应对新漏洞一样,生物安全领域也需要发展更智能、更前瞻的筛查系统,以确保AI技术的进步不会成为安全防护的盲点。

结语

AI蛋白质设计技术的突破为生物医学研究开辟了新天地,同时也带来了生物安全领域的新挑战。微软团队发现的'生物0day漏洞'不仅是一个技术问题,更是一个关乎人类共同安全的警示。在拥抱技术进步的同时,我们必须建立与之匹配的安全防护体系,确保这一强大技术不会被滥用。生物安全无小事,只有科技与安全并重,我们才能真正实现技术造福人类的愿景。

蛋白质结构模型

蛋白质设计技术的进步使复杂三维结构的创建变得更容易。图片来源:Historical / Contributor