在科学探索的道路上,时间与效率是至关重要的因素。近年来,尽管科研投入不断增加,研究团队规模日益扩大,但科学发现的速度却呈现出放缓的趋势。究其原因,科研人员在文献回顾、实验设计和数据分析等方面耗费了大量时间,这无疑成为了科学进步的瓶颈。
然而,一家名为FutureHouse的研究机构正试图通过人工智能(AI)技术来打破这一僵局。这家由Sam Rodriques博士(MIT 2019届毕业生)联合创立的实验室,致力于开发AI平台,以自动化科学研究中的关键步骤,从而加速科学发现的进程。该平台的核心是一系列AI智能体,它们分别擅长信息检索、信息整合、化学合成设计和数据分析等任务。FutureHouse的创始人Rodriques和Andrew White坚信,通过向每位科学家提供这些AI智能体的访问权限,能够突破科学研究中的最大瓶颈,并为解决人类面临的紧迫问题做出贡献。
Rodriques强调:“自然语言是科学的真正语言。虽然其他机构也在构建生物学的基础模型,让机器学习模型能够理解DNA或蛋白质的语言,但这还不够。科学发现并非直接以DNA或蛋白质的形式呈现,我们只能通过自然语言来表达发现、提出假设和进行推理。”
AI驱动科研的灵感
Rodriques在麻省理工学院攻读博士学位期间,师从Ed Boyden教授,致力于理解大脑的内部运作机制。这段经历成为了FutureHouse成立的最初灵感。Rodriques回忆道:“我在MIT攻读博士期间,深刻感受到即使我们掌握了关于大脑运作的所有信息,也难以充分理解,因为没有人有足够的时间阅读所有相关的文献。即使有人能够阅读所有文献,也无法将它们整合为一个全面的理论。这成为了FutureHouse项目的基石。”
早在2019年,Rodriques在他的博士论文中就提出了新型大型科研合作的必要性。毕业后,他曾在伦敦的弗朗西斯·克里克研究所运营一个实验室,但他逐渐发现自己更感兴趣的是那些无法由单个实验室解决的、更为广泛的科学问题。Rodriques表示:“我对于如何自动化或扩大科学研究的规模,以及哪些新的组织结构或技术能够提高科研效率非常感兴趣。”
2022年11月,当Chat-GPT 3.5发布时,Rodriques看到了构建更强大的模型、自主生成科学见解的潜力。大约在同一时间,他结识了罗切斯特大学的计算化学家Andrew White,后者获得了Chat-GPT 4的早期访问权限。White已经构建了第一个用于科学研究的大型语言智能体,两人一拍即合,共同创立了FutureHouse。
最初,FutureHouse的创始人希望为文献搜索、数据分析和假设生成等任务创建独立的AI工具。他们从数据收集开始,并于2024年9月发布了PaperQA。Rodriques称其为“世界上用于检索和总结科学文献信息的最佳AI智能体”。与此同时,他们还推出了Has Anyone,这是一款帮助科学家确定是否有人已经进行过特定实验或探索过特定假设的工具。
Rodriques回忆道:“我们当时只是坐在一起,思考‘作为科学家,我们经常会问哪些问题?’”
在今年5月1日FutureHouse正式发布其平台时,他们对部分工具进行了品牌重塑。Paper QA现在被称为Crow,而Has Anyone则更名为Owl。Falcon是一款能够编译和审查比Crow更多来源的智能体。另一个名为Phoenix的新智能体可以使用专业工具来帮助研究人员规划化学实验。Finch则是一款旨在自动化生物学中数据驱动发现的智能体。
5月20日,该公司展示了一个多智能体科学发现工作流程,以自动化科学过程的关键步骤,并识别出一种治疗干性年龄相关性黄斑变性(dAMD)的新候选药物,dAMD是全球导致不可逆失明的主要原因之一。6月,FutureHouse发布了ether0,这是一个用于化学的24B开放权重推理模型。
Rodriques表示:“你真的需要将这些智能体视为一个更大的系统的一部分。很快,文献搜索智能体将与数据分析智能体、假设生成智能体和实验计划智能体集成,它们将被设计成无缝协作。”
人人可用的AI智能体
如今,任何人都可以通过platform.futurehouse.org访问FutureHouse的智能体。该平台的发布在业内引起了广泛关注,并且已经开始有科学家利用这些智能体来加速研究的故事。
FutureHouse的一位科学家利用这些智能体识别出一个可能与多囊卵巢综合征相关的基因,并提出了该疾病的一种新的治疗假设。劳伦斯伯克利国家实验室的另一位研究人员使用Crow创建了一个AI助手,能够搜索PubMed研究数据库,以获取与阿尔茨海默病相关的信息。
另一家研究机构的科学家使用这些智能体对与帕金森病相关的基因进行了系统评价,发现FutureHouse的智能体比通用智能体表现更好。
Rodriques表示,如果科学家们将这些智能体视为智能助理科学家,而不是像Google Scholar这样的搜索引擎,就能最大限度地发挥该平台的作用。
Rodriques解释说:“那些寻找推测性信息的人倾向于从Chat-GPT等深度研究中获得更多信息,而那些寻找真正忠实的文献综述的人倾向于从我们的智能体中获得更多信息。”
Rodriques还认为,FutureHouse很快就能让其智能体利用研究论文中的原始数据来测试结果的可重复性,并验证结论。
从长远来看,为了保持科学进步的步伐,Rodriques表示,FutureHouse正在努力将隐性知识嵌入其智能体中,使其能够进行更复杂的分析,同时赋予智能体使用计算工具来探索假设的能力。
Rodriques总结道:“围绕科学的基础模型和蛋白质与DNA的语言模型已经取得了如此多的进展,以至于我们现在需要让我们的智能体访问这些模型以及人们通常用于进行科学研究的所有其他工具。构建基础设施,使智能体能够使用更专业的科学工具,这将至关重要。”
FutureHouse的AI平台通过自动化科研流程,极大地提升了科研效率和创新能力。通过提供强大的AI工具,FutureHouse正在赋能科研人员,加速科学发现,并为解决全球性挑战贡献力量。展望未来,随着AI技术的不断发展,我们有理由相信,FutureHouse将在推动科学进步的道路上发挥越来越重要的作用。