AI赋能科研:FutureHouse平台如何加速科学发现?

2

在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到各个领域,科研领域也不例外。由Sam Rodriques博士(MIT ’19)联合创立的FutureHouse公司,致力于通过开发AI智能体,自动化科研过程中的关键步骤,从而加速科学发现的进程。这一创新举措有望打破传统科研模式的瓶颈,为解决人类面临的重大挑战提供新的途径。

科研生产力面临的挑战

近年来,多位研究人员对过去50年的科研进展进行了深入分析,得出了一个令人担忧的结论:科学研究的生产力正在下降。与过去相比,如今的科学发现需要投入更多的时间、资金和人力。尽管对于这种减缓的原因有多种解释,但一个重要的因素是,随着研究变得越来越复杂和专业化,科学家们不得不花费更多的时间来审阅文献、设计复杂的实验和分析数据。

Science images showing a star cluster in space, a cross section of the Earth’s crust, neurons, plant cells, and a computer chip

FutureHouse的AI平台:科研加速器

为了应对这一挑战,FutureHouse推出了一个AI平台,旨在自动化科研过程中的许多关键步骤。该平台由一系列专门用于信息检索、信息整合、化学合成设计和数据分析等任务的AI智能体组成。FutureHouse的创始人Sam Rodriques和Andrew White相信,通过让每位科学家都能使用他们的AI智能体,他们可以突破科学领域最大的瓶颈,并帮助解决人类面临的一些最紧迫的问题。

Rodriques表示:“自然语言是科学的真正语言。其他人正在为生物学构建基础模型,其中机器学习模型使用DNA或蛋白质的语言,这非常强大。但发现并非以DNA或蛋白质的形式呈现。我们知道如何呈现发现、提出假设和推理的唯一方法是使用自然语言。”

解决科研瓶颈的思路

Rodriques在麻省理工学院攻读博士学位期间,致力于了解大脑的内部运作机制。他意识到,即使掌握了关于大脑如何运作的所有必要信息,人们也无法充分理解,因为没有人有时间阅读所有相关文献。即使他们能够阅读所有文献,也无法将其整合为全面的理论。这成为了FutureHouse成立的基石。

2019年,Rodriques在他的博士论文的最后一章中撰写了关于新型大型研究合作的需求。毕业后,他曾在伦敦的弗朗西斯·克里克研究所运营一个实验室,但他发现自己越来越关注科学领域中单个实验室无法解决的广泛问题。

Rodriques说:“我感兴趣的是如何自动化或扩大科学研究,以及哪些新型组织结构或技术能够释放更高的科学生产力。”

技术突破与平台发布

2022年11月,当Chat-GPT 3.5发布时,Rodriques看到了构建更强大模型的前景,这些模型可以独立生成科学见解。大约在同一时间,他遇到了罗切斯特大学的计算化学家Andrew White,后者获得了Chat-GPT 4的早期访问权限。White已经构建了第一个用于科学的大型语言智能体,两人联手创办了FutureHouse。

最初,创始人希望为文献搜索、数据分析和假设生成等任务创建不同的AI工具。他们从数据收集开始,最终于2024年9月发布了PaperQA,Rodriques称其为世界上最好的AI智能体,用于检索和总结科学文献中的信息。大约在同一时间,他们发布了Has Anyone,这是一种让科学家确定是否有人进行过特定实验或探索过特定假设的工具。

Rodriques回忆说:“我们当时只是坐在一起问,‘作为科学家,我们一直都在问哪些问题?’”

今年5月1日,FutureHouse正式发布其平台,并对其部分工具进行了品牌重塑。Paper QA现在被称为Crow,Has Anyone现在被称为Owl。Falcon是一种能够编译和审查比Crow更多来源的智能体。另一种名为Phoenix的新智能体可以使用专门的工具来帮助研究人员规划化学实验。Finch是一种旨在自动化生物学中数据驱动发现的智能体。

5月20日,该公司演示了一个多智能体科学发现工作流程,以自动化科学过程的关键步骤,并确定了一种新的治疗干性老年黄斑变性(dAMD)的候选药物,dAMD是全球不可逆失明的主要原因。6月,FutureHouse发布了ether0,这是一个用于化学的24B开放权重推理模型。

Rodriques表示:“你真的必须将这些智能体视为更大系统的一部分。很快,文献搜索智能体将与数据分析智能体、假设生成智能体、实验计划智能体集成,并且它们都将被设计成无缝协作。”

AI智能体赋能科研人员

如今,任何人都可以在platform.futurehouse.org上访问FutureHouse的智能体。该公司的平台发布在业内引起了轰动,并且已经开始有关于科学家使用这些智能体来加速研究的故事。

FutureHouse的一位科学家使用这些智能体来识别可能与多囊卵巢综合征相关的基因,并提出了该疾病的新治疗假设。劳伦斯伯克利国家实验室的另一位研究人员使用Crow创建了一个AI助手,能够搜索PubMed研究数据库中与阿尔茨海默病相关的信息。

另一家研究机构的科学家使用这些智能体对与帕金森病相关的基因进行了系统评价,发现FutureHouse的智能体比通用智能体表现更好。

Rodriques表示,那些将这些智能体视为智能助理科学家,而不是像Google Scholar一样的工具的科学家,能够从该平台中获得最大的收益。

Rodriques解释说:“那些寻找推测的人倾向于从Chat-GPT o3深度研究中获得更多信息,而那些寻找真正忠实的文献综述的人倾向于从我们的智能体中获得更多信息。”

Rodriques还认为,FutureHouse很快将达到一个程度,其智能体可以使用研究论文中的原始数据来测试其结果的可重复性并验证结论。

从长远来看,为了保持科学进步的步伐,Rodriques表示FutureHouse正在努力将隐性知识嵌入到其智能体中,以便能够执行更复杂的分析,同时还赋予智能体使用计算工具来探索假设的能力。

Rodriques说:“围绕科学的基础模型以及蛋白质和DNA的语言模型已经取得了如此多的进展,以至于我们现在需要让我们的智能体访问这些模型以及人们通常用于进行科学研究的所有其他工具。构建基础设施以允许智能体使用更多专门的科学工具将至关重要。”

FutureHouse的AI平台为科研人员提供了一个强大的工具,可以加速科学发现的进程。通过自动化科研过程中的关键步骤,AI智能体可以帮助科学家们更高效地利用现有知识,探索新的研究方向,并最终解决人类面临的重大挑战。