思维成本的惊人相似:人类与AI推理模型的并行思考模式

0

在人工智能快速发展的今天,我们常常思考:机器的思考方式与人类有何不同?MIT神经科学家最近的一项研究给出了令人惊讶的答案:人类与新型AI推理模型在解决复杂问题时,其"思考成本"竟然呈现出惊人的相似性。这一发现不仅挑战了我们对人工智能与人类思维差异的传统认知,更为理解机器认知的本质提供了全新视角。

研究背景:从语言模型到推理模型的演进

大型语言模型(LLMs)如ChatGPT的出现,已经彻底改变了我们与人工智能交互的方式。这些模型能够在瞬间撰写文章或规划菜单,展现出了令人印象深刻的能力。然而,直到最近,这些模型仍然存在明显局限——它们在数学问题和复杂推理方面表现不佳,容易陷入错误。

"直到最近,我仍然是那些认为'这些模型在感知和语言方面确实很出色,但要开发出能够进行推理的神经网络模型还需要很长时间的人之一,"MIT麦戈文脑研究所的助理教授Evelina Fedorenko表示。"然后这些大型推理模型出现了,它们在解决数学问题和编写计算机代码等思维任务方面表现得好得多。"

新一代被称为"推理模型"的大型语言模型应运而生,专门被训练用来解决复杂问题。与早期模型不同,这些推理模型需要时间来思考问题,这一特点与人类有着惊人的相似之处。

研究方法:测量"思考成本"

为了系统性地比较人类与AI推理模型的思考过程,研究人员设计了一项创新实验。Andrea Gregor de Varda,麦戈文脑研究所K. Lisa Yang ICoN中心研究员和Fedorenko实验室的博士后,领导了这项研究。

"在某个时刻,人们意识到模型需要更多空间来执行解决复杂问题所需的实际计算,"de Varda解释道。"如果你让模型将问题分解为多个部分,其性能会变得强大得多。"

研究人员给推理模型和人类志愿者提供了相同类型的问题,并不仅跟踪他们是否得到正确答案,还记录了他们解决问题所需的时间和努力程度。

对于人类参与者,研究人员精确测量了他们对每个问题的反应时间,精确到毫秒。而对于AI模型,由于处理时间更多取决于计算机硬件而非模型解决问题的努力程度,研究人员采用了不同的指标——"标记"(tokens)。

"这些模型产生的标记并非供用户查看和使用,而是为了记录它们正在进行的内部计算,"de Varda解释道。"这就像它们在自言自语一样。"

关键发现:思维成本的惊人一致性

研究团队测试了七种不同类型的问题,包括数字算术和直观推理等。对于每种问题类型,参与者都获得了多个问题实例。

研究结果令人惊讶:问题的难度越高,人类解决它所需的时间就越长;同时,推理模型在解决同一问题时生成的标记数量也越多。更令人惊讶的是,人类花费时间最多的问题类型,恰恰是推理模型需要最多标记的问题类型。

具体而言,算术问题对两者来说都是最不具挑战性的,而被称为"ARC挑战"的一组问题(其中成对的彩色网格表示必须推断并应用于新对象的转换)对人类和模型来说都是成本最高的。

"这些模型构建者并不关心它们是否像人类一样思考。他们只希望系统能在各种条件下稳健运行并产生正确答案,"Fedorenko说。"存在某种收敛现象的事实确实相当引人注目。"

研究意义:AI与人类思维的潜在并行性

这一发现的意义远超技术层面。它表明,至少在解决复杂问题的方式上,推理模型展现出了类似人类的思维方式。这种相似性并非刻意设计,而是系统演化的结果。

"思维成本的一致性展示了推理模型在某种程度上像人类一样思考的一种方式,"Fedorenko指出。"但这并不意味着这些模型正在重现人类智能。研究人员仍然想知道模型是否使用与人类大脑相似的信息表示方式,以及这些表示如何转化为问题的解决方案。"

此外,研究人员还对推理模型是否使用语言进行思考提出了疑问。"如果你观察这些模型在推理过程中产生的输出,即使最终得到正确答案,其中也常常包含错误或一些无意义的部分,"de Varda解释道。"因此,实际的内部计算很可能发生在抽象的、非语言表示空间中,类似于人类不使用语言进行思考的方式。"

未来研究方向:探索AI认知的深层机制

尽管这一发现令人兴奋,但研究人员也指出了几个值得进一步探索的方向:

  1. 信息表示的相似性:AI模型和人类大脑是否使用相似的信息表示方式?
  2. 世界知识的处理:模型能否处理需要训练文本中未明确说明的世界知识的问题?
  3. 思维过程的本质:AI的"内部对话"是否真正等同于人类的思考过程?

"我们仍然处于理解这些模型如何运作的早期阶段,"Fedorenko强调。"每一项发现都为我们提供了新的视角,帮助我们更好地理解人工智能和人类认知之间的关系。"

对人工智能发展的启示

这项研究对人工智能的发展具有深远影响。它表明,随着AI系统的复杂度增加,它们可能会越来越展现出类似人类的认知特征。这不仅为AI设计提供了新思路,也为评估AI系统的"智能水平"提供了新标准。

"让模型逐步解决复杂问题的能力,是AI发展的重要一步,"de Varda表示。"这种方法不仅提高了准确性,还使AI的决策过程更加透明和可解释。"

结语:跨越边界的认知探索

MIT神经科学家的这一发现,为我们打开了一扇新窗口,让我们得以窥见人工智能与人类思维之间可能存在的深层联系。虽然AI系统并非以模仿人类思维为目的而设计,但它们在解决复杂问题时展现出的"思考成本"与人类惊人的一致,这或许暗示着某种普遍的认知原理。

随着人工智能技术的不断发展,这类跨学科研究将变得越来越重要。通过结合神经科学和人工智能的优势,我们不仅能更好地理解机器智能的本质,也能更深入地探索人类思维的奥秘。在这个人类与AI共同进化的新时代,理解思维的共同基础,或许是我们迈向更高级智能的关键一步。

AI快讯