AI思维与人类大脑惊人相似:MIT揭示推理模型的思考成本奥秘

0

在人工智能领域,我们常常惊叹于机器的智能,但很少思考它们是否真的在'思考'。麻省理工学院(MIT)的神经科学家们最近的一项研究为我们带来了令人深思的发现:新一代AI推理模型与人类在解决复杂问题时的思考方式竟然存在惊人相似。这一发现不仅挑战了我们对AI工作原理的认知,也为理解人类思维提供了全新视角。

研究背景:从语言模型到推理模型的飞跃

大型语言模型(LLM)如ChatGPT能够快速撰写文章或规划菜单,但在过去,它们很容易被某些问题难倒。这些主要依赖语言模式回应查询的模型,在数学问题和复杂推理方面表现不佳。然而,情况突然发生了变化。

新一代被称为'推理模型'的大语言模型正在被训练以解决复杂问题。与人类一样,它们也需要一些时间来思考这些问题——值得注意的是,MIT麦戈文脑研究所的科学家们发现,需要推理模型进行最多处理的问题,恰恰是人类需要花时间思考的问题。换句话说,他们今天在《PNAS》期刊上报告称,推理模型的'思考成本'与人类的思考成本相似。

研究方法:时间与标记的测量

这项研究由脑与认知科学副教授、麦戈文研究所研究员Ev Fedorenko领导。研究团队包括K. Lisa Yang ICoN中心研究员、Fedorenko实验室博士后Andrea Gregor de Varda。

de Varda想要更系统地研究这种关系。他给推理模型和人类志愿者提供了相同的问题集,不仅跟踪他们是否得到正确答案,还记录他们到达答案所需的时间和精力。

这意味着要精确测量人们回应每个问题所需的时间,精确到毫秒。对于模型,de Varda使用了不同的指标。由于处理时间更多取决于计算机硬件而非模型解决问题的努力,因此测量处理时间没有意义。相反,他跟踪了'标记'(tokens),这是模型内部思维链的一部分。

"它们产生的标记并非供用户看到和使用,而是为了记录它们正在进行的内部计算,"de Varda解释道。"这就像它们在自言自语。"

研究发现:思考成本的惊人匹配

人类和推理模型都被要求解决七种不同类型的问题,如数字算术和直观推理。对于每个问题类别,他们都被给出了许多问题。给定问题越难,人们解决它所需的时间越长——而人们解决问题的时间越长,推理模型在得出自己解决方案时产生的标记就越多。

同样,人类花最长时间解决的问题类别,也是需要模型最多标记的类别:算术问题需求最少,而被称为'ARC挑战'的一组问题(其中成对的彩色网格表示必须推断并应用于新对象的变换)对人和模型来说都是成本最高的。

Fedorenko指出:"这种思考成本的惊人匹配表明,推理模型在某种程度上确实在像人类一样思考。但这并不意味着这些模型正在重现人类智能。研究人员仍然想知道模型是否使用与人类大脑相似的信息表示方式,以及这些表示如何转化为解决问题的方案。"

研究意义:AI与人类认知的交叉点

这一发现具有重要意义,因为它表明,即使没有刻意模仿人类思维,AI系统也可能发展出与人类相似的认知机制。正如Fedorenko所言:"构建这些模型的人并不关心它们是否像人类一样思考。他们只希望系统能在各种条件下稳健运行并产生正确回应。存在某种 convergence 确实相当引人注目。"

AI思维与人类大脑对比

图:AI与人类思维过程的对比示意图

未来研究方向

研究团队指出,尽管推理模型在解决问题时会产生内部独白,但它们不一定在用语言思考。"如果你观察这些模型在推理时产生的输出,即使模型最终得出正确答案,它也常常包含错误或一些无意义的部分。因此,实际的内部计算很可能发生在抽象的、非语言表示空间中,类似于人类不使用语言进行思考的方式。"

未来的研究将探索几个关键方向:

  1. 信息表示的相似性:模型是否使用与人类大脑相似的信息表示方式
  2. 世界知识的整合:模型能否处理训练文本中未明确表述的需要世界知识的问题
  3. 思维过程的本质:AI的'思考'与人类的认知过程究竟有何异同

行业影响与启示

这一发现对人工智能研究和开发具有重要启示:

  1. AI设计的新思路:或许我们可以从人类认知机制中获取灵感,设计更高效的AI系统
  2. AI评估的新标准:评估AI能力时,不仅要看结果,还应关注其解决问题的过程
  3. 人机协作的新模式:理解AI的'思考'方式有助于开发更好的人机协作工具

结论

MIT的这项研究揭示了AI推理模型与人类思维之间一个意想不到的相似点:思考成本的相似性。这一发现不仅丰富了我们对AI工作原理的理解,也为探索人类思维的奥秘提供了新工具。随着AI技术的不断发展,这种跨学科的研究方法将帮助我们更深入地理解智能的本质,无论是人工的还是自然的。

正如Fedorenko所言:"这种 convergence 确实相当引人注目。"这不仅是对AI研究的肯定,也是对人类认知科学研究的推动。在人工智能与人类认知的交叉点上,我们或许能找到理解智能本质的关键。