AI驱动科研加速:FutureHouse如何重塑科学发现的未来

1

引言:科学研究的瓶颈与AI的破局之路

近年来,科学界普遍观察到一个令人担忧的趋势:科学研究的生产力正在下降。与过去相比,如今的科研突破需要耗费更多的时间、资金以及更大的团队协作。尽管对于这种减缓的原因众说纷纭,但一个关键因素在于,随着研究变得日益复杂和专业化,科学家们不得不花费大量时间来查阅文献、设计精密的实验以及分析数据。

面对这一挑战,由Sam Rodriques博士(麻省理工学院2019届毕业生)联合创立的FutureHouse应运而生。这家研究实验室致力于通过人工智能(AI)平台来加速科学研究的进程,该平台旨在自动化科学发现过程中诸多关键步骤。FutureHouse的AI平台由一系列专门用于信息检索、信息整合、化学合成设计和数据分析等任务的AI代理组成。这些智能代理的设计目标是帮助科学家们更高效地完成科研工作,从而突破科学研究的瓶颈。

FutureHouse的愿景:AI赋能,人人可及

FutureHouse的创始人Sam Rodriques和Andrew White坚信,通过让每一位科学家都能访问他们的AI代理,他们可以突破科学研究中的最大瓶颈,并帮助解决人类面临的一些最紧迫的问题。他们的愿景是创建一个强大的AI平台,使科学家们能够更专注于创新和发现,而不是被繁琐的日常任务所困扰。

“自然语言是科学的真正语言,”Rodriques说道。“其他人正在为生物学构建基础模型,其中机器学习模型使用DNA或蛋白质的语言,这非常强大。但科学发现并非以DNA或蛋白质的形式呈现。我们知道如何呈现发现、提出假设和进行推理的唯一方式是使用自然语言。”

灵感起源:博士研究期间的顿悟

Rodriques在麻省理工学院攻读博士学位期间,师从Ed Boyden教授,致力于理解大脑的内部运作机制。正是这段经历激发了他创建FutureHouse的想法。

“FutureHouse的整个理念都源于我在麻省理工学院攻读博士学位期间产生的一个印象,即即使我们掌握了关于大脑如何运作的所有必要信息,我们也无法真正理解它,因为没有人有时间阅读所有的文献,”Rodriques解释说。“即使他们能够阅读所有的文献,他们也无法将其组合成一个全面的理论。这是FutureHouse拼图中的一个基础部分。”

Science images showing a star cluster in space, a cross section of the Earth’s crust, neurons, plant cells, and a computer chip

2019年,Rodriques在他的博士论文的最后一章中写到了对新型大型研究合作的需求。毕业后,他曾在伦敦的弗朗西斯·克里克研究所运营一个实验室,但他发现自己越来越倾向于解决科学领域中那些单一实验室无法承担的广泛问题。

“我对如何自动化或扩大科学研究规模,以及哪些新的组织结构或技术能够释放更高的科学生产力感兴趣,”Rodriques说。

技术突破:从Chat-GPT到科学AI代理

2022年11月,当Chat-GPT 3.5发布时,Rodriques看到了构建更强大模型的前景,这些模型可以自主生成科学见解。大约在同一时间,他遇到了罗切斯特大学的计算化学家Andrew White,后者获得了Chat-GPT 4的早期访问权限。White已经构建了第一个用于科学的大型语言代理,两位研究人员携手创立了FutureHouse。

最初,创始人希望为文献搜索、数据分析和假设生成等任务创建不同的AI工具。他们从数据收集开始,最终于2024年9月发布了PaperQA,Rodriques称其为世界上用于检索和总结科学文献信息的最佳AI代理。大约在同一时间,他们发布了Has Anyone,这是一款让科学家确定是否有人进行过特定实验或探索过特定假设的工具。

“我们只是坐在一起问,‘作为科学家,我们一直都在问哪些问题?’”Rodriques回忆道。

FutureHouse平台:AI代理矩阵

当FutureHouse于今年5月1日正式推出其平台时,它对其部分工具进行了品牌重塑。Paper QA现在被称为Crow,而Has Anyone现在被称为Owl。Falcon是一种能够编译和审查比Crow更多来源的代理。另一种新的代理Phoenix可以使用专门的工具来帮助研究人员规划化学实验。而Finch是一种旨在自动化生物学中数据驱动发现的代理。

5月20日,该公司展示了一个多代理科学发现工作流程,以自动化科学过程的关键步骤,并确定了一种新的治疗干性年龄相关性黄斑变性(dAMD)的候选药物,dAMD是全球导致不可逆失明的主要原因。

6月,FutureHouse发布了ether0,这是一个用于化学的24B开放权重推理模型。

“你真的必须将这些代理视为一个更大的系统的一部分,”Rodriques说。“很快,文献搜索代理将与数据分析代理、假设生成代理、实验规划代理集成,它们都将被设计成无缝协同工作。”

开放平台:赋能每一位科研人员

如今,任何人都可以通过platform.futurehouse.org访问FutureHouse的代理。该公司的平台发布在业界引起了轰动,并且已经开始有关于科学家使用这些代理来加速研究的故事。

FutureHouse的一位科学家使用这些代理来识别可能与多囊卵巢综合征相关的基因,并提出了该疾病的一种新的治疗假设。劳伦斯伯克利国家实验室的另一位研究人员使用Crow创建了一个AI助手,能够搜索PubMed研究数据库以获取与阿尔茨海默病相关的信息。

另一家研究机构的科学家使用这些代理对与帕金森病相关的基因进行系统评价,发现FutureHouse的代理比通用代理表现更好。

Rodriques表示,将这些代理视为智能助理科学家而非Google Scholar的科学家可以从该平台获得最大的收益。

“寻找推测的人倾向于从Chat-GPT o3深度研究中获得更多好处,而寻找真正忠实的文献评论的人倾向于从我们的代理中获得更多好处,”Rodriques解释说。

Rodriques还认为,FutureHouse很快将达到一个临界点,其代理可以使用研究论文中的原始数据来测试其结果的可重复性并验证结论。

未来展望:持续创新,赋能科学进步

从长远来看,为了保持科学进步的步伐,Rodriques表示FutureHouse正在努力将隐性知识嵌入到其代理中,以便能够执行更复杂的分析,同时赋予代理使用计算工具探索假设的能力。

“围绕科学的基础模型以及蛋白质和DNA的语言模型已经取得了如此多的进展,以至于我们现在需要让我们的代理访问这些模型以及人们通常用于进行科学研究的所有其他工具,”Rodriques说。“构建基础设施以允许代理使用更专业的科学工具将至关重要。”

The Hubble Space Telescope, the Human Genome Project, and the Large Hadron Collider/CERN MIT engineers have devised a way to create 3-D nanoscale objects by patterning a larger structure with a laser and then shrinking it. This image shows a complex structure prior to shrinking. Microscopic image of a network of neurons

结论:AI驱动的科学未来

FutureHouse的出现标志着科学研究领域进入了一个新的时代。通过利用人工智能的力量,FutureHouse正在赋能科学家们更高效地进行研究,从而加速科学发现的进程。随着AI技术的不断发展,我们有理由相信,FutureHouse将在解决人类面临的重大挑战方面发挥越来越重要的作用。该平台不仅为科研人员提供了强大的工具,更预示着未来科学研究的新模式——人与AI协同,共同探索知识的边界。

FutureHouse的AI代理平台,如Crow、Owl、Falcon、Phoenix和Finch,各自承担着不同的科研任务,共同构建了一个强大的AI科研生态系统。这些工具不仅可以帮助科学家们更快速地查阅文献、分析数据和生成假设,还可以自动化实验规划和数据驱动的发现过程。通过将这些AI代理集成到一个无缝协同工作的系统中,FutureHouse正在为科学研究带来一场革命。

未来,FutureHouse将继续致力于创新,不断提升其AI代理的能力,并将其与更多的科学工具和模型集成。通过这种方式,FutureHouse希望能够为科学家们提供更强大的支持,帮助他们解决更复杂的问题,并最终推动科学的进步,为人类带来福祉。