BoltzGen:AI革命性蛋白质结合物设计技术解析

0

在生物医学领域,人工智能正以前所未有的速度推动着科学边界的扩展。2025年10月,MIT研究人员发布的BoltzGen模型,标志着AI技术从理解生物学向工程生物学的重大转变。这一突破性技术能够从头生成针对任何生物学目标的蛋白质结合物,直接进入药物发现流程,为解决'不可成药'疾病靶点提供了全新可能。

从预测到生成:AI生物学的范式转变

BoltzGen建立在Boltz-2模型的基础之上,后者是今年夏天引起广泛关注的开放源生物分子结构预测模型,能够预测蛋白质结合亲和力。而BoltzGen则更进一步,成为首个生成可直接进入药物发现流程的新型蛋白质结合物的模型。

"大多数工业或学术界使用的模型只能进行结构预测或蛋白质设计中的一种,"BoltzGen的第一作者、MIT博士生Hannes Stärk解释道。"而且它们仅限于生成能够成功结合到简单'靶点'的特定类型蛋白质。"

这种局限性类似于学生回答看起来像家庭作业的测试题——只要训练数据与靶点设计相似,模型通常就能工作。然而,现有方法几乎总是在已经存在结合物结构的靶点上评估,在面对更具挑战性的靶点时性能往往会下降。

三项关键创新:突破蛋白质设计瓶颈

BoltzGen之所以能够实现这一突破,主要归功于三项关键创新:

1. 多功能统一设计

BoltzGen能够执行多种任务,统一了蛋白质设计和结构预测,同时保持最先进的性能。这种多功能性不仅意味着可以解决更多任务,还意味着单个任务的模型质量得到提升。

"通用模型不仅意味着我们可以解决更多任务,"Stärk指出,"此外,由于物理模拟是通过示例学习的,更通用的训练方案提供了更多包含可推广物理模式的示例,从而使我们在单个任务上获得更好的模型。"

2. 湿实验室反馈的约束条件

BoltzGen的内置约束条件经过湿实验室合作者的反馈设计,确保模型创建的功能蛋白质不会违背物理或化学定律。这一特点至关重要,因为它确保了生成蛋白质的实际可应用性。

3. 对'不可成药'目标的严格测试

研究团队对BoltzGen进行了严格的评估过程,在26个靶点上测试了模型,从治疗相关案例到明确选择与训练数据不相似的靶点。这一综合验证过程在学术界和工业界的八个湿实验室进行,展示了模型的广度和突破性药物开发的潜力。

学术界与工业界的积极响应

BoltzGen的发布引起了学术界和工业界的广泛关注。2025年10月30日,超过300名来自学术界和工业界的人士涌入礼堂参加由MIT Jameel Clinic举办的BoltzGen研讨会。Stärk在会上详细介绍了这一技术,而该模型在10月22日举行的第七届分子机器学习会议上已经进行了预览。

工业合作伙伴Parabilis Medicines在湿实验室环境中测试了BoltzGen后对其潜力表示赞赏:"我们认为将BoltzGen整合到现有的Helicon肽计算平台能力中,将加速我们为重大人类疾病提供变革性药物的进展。"

开源革命与行业影响

Boltz-1、Boltz-2和现在的BoltzGen的开放源代码发布,为药物开发带来了新的机会和透明度,同时也可能意味着生物技术和制药行业需要重新评估其产品。

在社交媒体平台X上关于BoltzGen的热议中,LabGenius的首席机器学习科学家Justin Grace提出了一个尖锐的问题:"聊天AI系统的私有到开放性能时间滞后是[七]个月且正在缩短,"Grace在一篇帖子中写道,"在蛋白质领域看起来甚至更短。当我们可以只等几个月获得免费版本时,'即服务'结合物公司将如何收回投资?"

这一质疑反映了开源AI模型对传统商业模式的挑战,也预示着生物技术行业可能面临的结构性变革。

学术视角:解决未解问题

对于学术界而言,BoltzGen代表了科学可能性的扩展和加速。

"我的学生经常问我的问题是,'AI可以在哪里改变治疗游戏?'"资深合著者、MIT Jameel Clinic的AI负责人、计算机科学与人工智能实验室(CSAIL)成员Regina Barzilay教授说。"除非我们确定不可成药的靶点并提出解决方案,否则我们无法改变游戏,"她补充道,"这里的重点是未解决的问题,这使Hannes的工作与该领域的其他人区别开来。"

资深合著者Tommi Jaakkola教授指出,"像BoltzGen这样完全开源发布的模型能够促进更广泛的社区努力,加速药物设计能力。"

未来展望:AI重塑生物分子设计

展望未来,Stärk相信生物分子设计的未来将被AI模型颠覆。

"我想构建帮助我们操纵生物学以解决疾病,或使用分子机器执行我们甚至尚未想象的任务的工具,"他说,"我想提供这些工具,使生物学家能够想象他们甚至没有想过的事情。"

Hannes Stärk stands in front of a slide presentation in front of a large audience inside of a packed lecture hall.

超过300人参加了10月30日的BoltzGen研讨会,就在其发布后几天。

技术细节与验证过程

BoltzGen的开发团队进行了详尽的验证过程,确保模型的可靠性和实用性。这一过程不仅包括计算验证,还涉及湿实验室的实际测试,确保生成蛋白质在真实世界中的功能性和稳定性。

研究团队选择了26个靶点进行测试,这些靶点涵盖了治疗相关案例和特意选择与训练数据不相似的案例。这种全面的测试方法确保了BoltzGen在各种条件下的适用性和鲁棒性。

在八个湿实验室进行的验证过程,分布在学术界和工业界合作伙伴之间,展示了BoltzGen的广泛适用性和在药物开发中的潜在价值。这种跨学科、跨行业的合作模式,也代表了现代生物医学研究的发展趋势。

与现有技术的比较

与现有的蛋白质设计工具相比,BoltzGen具有显著优势。大多数现有工具要么专注于结构预测,要么专注于蛋白质设计,很少有工具能够同时处理这两个方面。

此外,现有工具通常只在已有结合物结构的靶点上测试,而BoltzGen则专门针对'不可成药'靶点进行了测试,这些靶点是传统方法难以处理的。这种针对性的测试方法,使BoltzGen在处理复杂疾病靶点时表现出色。

对生物技术和制药行业的影响

BoltzGen的发布对生物技术和制药行业可能产生深远影响。首先,开源模型的发布降低了药物开发的门槛,使更多研究机构能够参与药物发现过程。

其次,AI生成蛋白质的能力可能加速药物开发周期,降低研发成本。传统药物开发过程通常需要数年时间,而AI技术可以显著缩短这一过程。

然而,这也引发了关于商业模式和知识产权的讨论。正如Justin Grace所指出,当高质量的开源模型可用时,商业'即服务'公司如何保持竞争力?这可能导致行业向更注重增值服务而非基础工具的方向发展。

伦理与安全考虑

随着AI在生物设计领域的应用日益广泛,伦理和安全问题也日益凸显。BoltzGen等AI工具能够设计和生成新型蛋白质,这些蛋白质可能具有未知的生物学效应。

研究团队已经意识到了这一问题,并在模型设计中纳入了安全约束,确保生成的蛋白质不会违背已知的物理或化学定律。然而,随着技术的进步,可能需要更全面的伦理框架和监管机制,以确保AI生物设计的安全和负责任使用。

结论:开启AI生物学新纪元

BoltzGen的发布标志着AI从理解生物学向工程生物学的重大转变。这一技术不仅展示了AI在生物医学领域的巨大潜力,也为解决'不可成药'疾病靶点提供了全新可能。

随着开源模型的普及和技术的不断进步,我们可以预见AI将在生物分子设计领域扮演越来越重要的角色。这不仅将加速药物开发进程,也可能彻底改变我们对生物系统的理解和操控方式。

正如Stärk所展望的,未来的生物分子设计将由AI模型主导,帮助我们解决疾病,甚至实现目前难以想象的分子机器应用。这一新纪元不仅代表着技术的突破,也象征着人类对生命奥秘的探索进入了一个全新的阶段。

Hannes Stärk presenting slides to an audience inside of an auditorium.

BoltzGen在10月22日举行的第七届分子机器学习会议上进行了预览。

参考文献

  1. Stärk, H., et al. (2025). "BoltzGen: Toward Universal Binder Design." MIT Abdul Latif Jameel Clinic for Machine Learning in Health.
  2. Boltz-2: Open-source biomolecular structure prediction model. BioRxiv, 2025.
  3. 7th Molecular Machine Learning Conference. MIT, 2025.

注:本文基于MIT官方新闻稿及相关技术资料撰写,旨在介绍BoltzGen技术及其在生物医学领域的应用前景。