AI赋能科研:FutureHouse如何重塑科学发现的未来

1

在科技日新月异的今天,人工智能(AI)正以惊人的速度渗透到各个领域,其中科学研究领域的变化尤为引人注目。由麻省理工学院(MIT)2019届博士毕业生山姆·罗德里格斯(Sam Rodriques)联合创办的FutureHouse公司,正致力于通过AI技术自动化科学研究的关键步骤,从而加速科学发现的进程。这一创新举措不仅预示着科研模式的变革,也为解决人类面临的诸多挑战带来了新的希望。

科研效率的瓶颈

过去50年间,尽管科研投入不断增加,但科学生产力却呈现下降趋势。科研人员需要花费更多的时间、投入更多的资金,并依赖更大的团队才能取得突破性的发现。造成这一现象的原因是多方面的,其中一个重要因素是科研工作的日益复杂化和专业化。科学家们需要花费大量时间查阅文献、设计复杂的实验和分析数据,这无疑成为了科研效率提升的瓶颈。

FutureHouse的AI平台:科研加速器

为了打破这一瓶颈,FutureHouse推出了一个基于AI的平台,旨在自动化科学研究中的关键步骤。该平台由一系列专门用于信息检索、信息合成、化学合成设计和数据分析的AI智能体组成。这些智能体能够帮助科学家们更高效地完成科研任务,从而加速科学发现的进程。

FutureHouse的创始人山姆·罗德里格斯和安德鲁·怀特(Andrew White)坚信,通过让每位科学家都能使用他们的AI智能体,可以突破科学研究中的最大瓶颈,并帮助解决人类面临的最紧迫问题。罗德里格斯表示:“自然语言是科学的真正语言。其他人正在为生物学构建基础模型,让机器学习模型能够理解DNA或蛋白质的语言,这固然强大。但科学发现并非以DNA或蛋白质的形式呈现。我们唯一能够表达发现、提出假设和进行推理的方式是使用自然语言。”

Science images showing a star cluster in space, a cross section of the Earth’s crust, neurons, plant cells, and a computer chip

灵感源泉:博士研究经历

罗德里格斯在MIT攻读博士学位期间,师从埃德·博伊登(Ed Boyden)教授,致力于理解大脑的内部运作机制。这段经历为FutureHouse的诞生提供了灵感。他回忆道:“在MIT攻读博士学位期间,我深刻地感受到,即使我们掌握了关于大脑如何运作的所有信息,我们也无法真正理解它,因为没有人有时间阅读所有的文献。即使他们能够阅读所有文献,也无法将其整合为一个全面的理论。这是FutureHouse拼图中的一个基础部分。”

罗德里格斯在他的博士论文的最后一章中,探讨了对新型大型研究合作的需求。2019年毕业后,他曾在伦敦弗朗西斯·克里克研究所(Francis Crick Institute)运营一个实验室,但他发现自己越来越关注科学领域的广泛问题,这些问题无法由单个实验室解决。

罗德里格斯表示:“我一直对如何自动化或扩大科学研究规模,以及哪些新的组织结构或技术能够释放更高的科学生产力感兴趣。”

抓住机遇:Chat-GPT的启发

2022年11月,当Chat-GPT 3.5发布时,罗德里格斯看到了构建更强大的模型、自主生成科学见解的途径。大约在同一时间,他结识了罗切斯特大学(University of Rochester)的计算化学家安德鲁·怀特,怀特获得了Chat-GPT 4的早期使用权。怀特构建了第一个用于科学研究的大型语言智能体,两位研究人员携手创立了FutureHouse。

起初,两位创始人希望为文献搜索、数据分析和假设生成等任务创建不同的AI工具。他们从数据收集开始,最终于2024年9月发布了PaperQA。罗德里格斯称其为世界上用于检索和总结科学文献信息的最佳AI智能体。大约在同一时间,他们还发布了一个名为Has Anyone的工具,让科学家能够确定是否有人进行过特定的实验或探索过特定的假设。

罗德里格斯回忆道:“我们只是坐在那里问,‘作为科学家,我们一直都在问哪些问题?’”

FutureHouse平台:AI智能体矩阵

FutureHouse于今年5月1日正式推出其平台,并对其部分工具进行了品牌重塑。Paper QA现在被称为Crow,Has Anyone则更名为Owl。Falcon是一个能够编译和审查比Crow更多来源的智能体。另一个名为Phoenix的新智能体可以使用专门的工具来帮助研究人员规划化学实验。Finch则是一个旨在自动化生物学中数据驱动发现的智能体。

5月20日,该公司展示了一个多智能体科学发现工作流程,以自动化科学过程的关键步骤,并确定了一种治疗干性年龄相关性黄斑变性(dAMD)的新候选药物,dAMD是全球导致不可逆失明的主要原因之一。6月,FutureHouse发布了ether0,这是一个用于化学的24B开放权重推理模型。

罗德里格斯表示:“你真的需要将这些智能体视为一个更大系统的一部分。很快,文献搜索智能体将与数据分析智能体、假设生成智能体和实验规划智能体集成,并且它们都将被设计为无缝协同工作。”

AI智能体:人人可用

如今,任何人都可以在platform.futurehouse.org上访问FutureHouse的智能体。该平台的发布在业界引起了轰动,并且已经开始有科学家利用这些智能体加速研究的故事出现。

FutureHouse的一位科学家利用这些智能体识别出一个可能与多囊卵巢综合征相关的基因,并提出了该疾病的一种新的治疗假设。劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)的另一位研究人员使用Crow创建了一个AI助手,能够搜索PubMed研究数据库,查找与阿尔茨海默病相关的信息。

另一家研究机构的科学家们使用这些智能体对与帕金森病相关的基因进行了系统评价,发现FutureHouse的智能体比通用智能体表现更好。

罗德里格斯表示,如果科学家们将这些智能体视为智能助手科学家,而不是像Google Scholar那样的工具,就能最大限度地利用该平台。

罗德里格斯解释说:“那些寻找推测性信息的人往往能从Chat-GPT等深度研究工具中获得更多好处,而那些寻找真正忠实的文献综述的人往往能从我们的智能体中获得更多好处。”

未来展望:可重复性与专业工具

罗德里格斯还认为,FutureHouse很快就能让其智能体使用研究论文中的原始数据来测试其结果的可重复性并验证结论。

从长远来看,为了保持科学进步的步伐,罗德里格斯表示,FutureHouse正在努力将隐性知识嵌入其智能体中,使其能够执行更复杂的分析,同时赋予智能体使用计算工具探索假设的能力。

罗德里格斯说:“围绕科学的基础模型以及蛋白质和DNA的语言模型已经取得了如此多的进展,以至于我们现在需要让我们的智能体能够访问这些模型以及人们通常用于进行科学研究的所有其他工具。构建基础设施以允许智能体使用更多专门的科学工具将至关重要。”

未来科学研究的展望

FutureHouse的AI平台正在为科学研究带来一场革命。通过自动化关键步骤、提高科研效率和促进跨学科合作,FutureHouse正在帮助科学家们更快地取得突破性发现,并解决人类面临的重大挑战。随着AI技术的不断发展,我们有理由相信,未来的科学研究将更加高效、智能和富有成效。

FutureHouse的创新实践为我们提供了一个宝贵的启示:AI不仅仅是一种工具,更是一种赋能科学研究、推动社会进步的强大引擎。我们期待着FutureHouse在未来能够继续引领AI在科学领域的应用,为人类带来更多的福祉。

随着FutureHouse等公司的不断创新,AI在科学研究领域的应用将迎来更加广阔的发展前景。我们有理由相信,在AI的助力下,科学研究将进入一个全新的时代,人类将能够更快地解开自然之谜,并创造更加美好的未来。

AI驱动的科研新范式

FutureHouse的崛起不仅仅是一家公司的成功,更代表着一种新的科研范式的兴起。AI正在成为科研人员不可或缺的助手,它能够帮助科学家们更高效地完成各项任务,从而将更多的时间和精力投入到创新性思考和实验中。这种AI驱动的科研新范式将极大地加速科学发现的进程,并为解决人类面临的诸多挑战提供新的思路和方法。

伦理与挑战

当然,AI在科学研究中的应用也面临着一些伦理和挑战。例如,如何确保AI的决策过程透明可信?如何避免AI在数据分析中引入偏见?如何保障科研数据的安全和隐私?这些问题需要我们认真思考和解决。只有在伦理和规范的框架下,AI才能真正成为推动科学进步的积极力量。

结语:AI赋能,科研未来

FutureHouse的故事告诉我们,AI正在深刻地改变着科学研究的方式。通过自动化、智能化和协作化,AI正在赋能科研人员,加速科学发现的进程,并为解决人类面临的重大挑战带来新的希望。让我们共同期待,在AI的助力下,科学研究将迎来更加美好的未来!