人脑与AI思维惊人相似:MIT揭示思考成本的平行演化

0

在人工智能领域,一个长期存在的问题是:机器思维与人类思维究竟有多相似?MIT的神经科学家们最近的一项研究给出了令人惊讶的答案:新一代AI推理模型与人类在解决复杂问题时,竟然展现出惊人的思维相似性。

研究背景:从语言模型到推理模型的飞跃

大型语言模型(如ChatGPT)能够快速撰写文章或规划菜单,但在不久前,它们仍然很容易被复杂问题难倒。这些主要依赖语言模式回应查询的模型,在数学问题和复杂推理方面表现不佳。然而,情况突然发生了变化。

新一代被称为"推理模型"的大型语言模型正在被训练来解决复杂问题。与它们的 predecessor 不同,这些模型需要时间来思考问题——而值得注意的是,MIT麦戈文脑研究所的科学家们发现,那些需要推理模型进行最多处理的问题,恰恰是人类需要花时间思考的同类问题。

"构建这些模型的人并不关心它们是否以人类的方式思考,"麦戈文研究所的副教授Ev Fedorenko表示,"他们只希望系统能在各种条件下稳健运行并产生正确答案。"她补充道:"存在某种收敛现象确实相当引人注目。"

研究方法:时间与标记的平行测量

为了更系统地研究AI与人类思维的相似性,研究人员Andrea Gregor de Varda给推理模型和人类志愿者提供了相同的问题集,不仅追踪他们是否得到正确答案,还记录他们到达答案所需的时间或精力。

对于人类,这意味着测量每个人回答每个问题所需的精确到毫秒的时间。对于模型,研究人员使用了不同的指标——由于处理时间更多取决于计算机硬件而非模型解决问题的努力程度,他们转而追踪"标记"(tokens),这是模型内部思维链的一部分。

"它们产生的不一定是用户可见的标记,而是为了追踪自己正在进行的内部计算,"de Varda解释道,"这就像它们在自言自语。"

研究发现:思考成本的惊人匹配

研究团队测试了七种不同类型的问题,包括数字算术和直观推理。对于每种问题类型,参与者都得到了大量问题。

研究结果令人震惊:一个问题越难,人类解决它所需的时间就越长;而人类解决问题的时间越长,推理模型在得出自己的解决方案时产生的标记就越多。

同样,人类花费最长时间解决的问题类别,也是需要模型生成最多标记的类别:算术问题需求最低,而被称为"ARC挑战"的一组问题(其中成对的彩色网格表示必须推断并应用于新对象的转换)对人类和模型来说都是成本最高的。

理论意义:自然收敛而非刻意设计

这一发现挑战了AI与人类思维完全不同的传统观念。研究人员强调,这种相似性并非刻意设计的结果,而是系统演化过程中自然出现的。

"人们构建这些模型时并不关心它们是否像人类一样思考,"Fedorenko强调,"他们只希望系统能在各种条件下稳健运行并产生正确答案。"她补充道:"存在某种收敛现象确实相当引人注目。"

这一发现为理解人工智能与人类认知的关系提供了新视角。它表明,即使没有刻意模仿人类,AI系统在问题解决方式上也会自然演化出与人类相似的思维模式。

研究局限与未来方向

尽管发现了这种思维相似性,研究人员仍指出,推理模型并不一定是在用语言思考。

"如果你观察这些模型在推理时产生的输出,即使最终得到正确答案,其中也常常包含错误或无意义的部分,"de Varda解释道,"因此,实际的内部计算很可能发生在抽象的、非语言表征空间中,类似于人类不使用语言进行思考的方式。"

研究人员仍希望了解模型是否使用与人类大脑相似的信息表征方式,以及这些表征如何转化为问题的解决方案。他们还好奇模型是否能够处理需要训练文本中未明确说明的世界知识的问题。

AI与人类思维对比

图:AI与人类在解决复杂问题时展现出相似的思考模式

行业影响:AI发展的新启示

这一发现对人工智能领域的发展具有重要意义。它表明,随着AI系统的不断进化,它们可能会自然发展出更多与人类思维相似的特征,这为开发更接近人类认知能力的AI系统提供了新思路。

同时,这一研究也提醒我们,评估AI系统的能力时,不应仅仅关注其输出结果,还应考虑其解决问题的过程和思维方式。理解AI如何思考,对于开发更安全、更可靠、更符合人类价值观的人工智能系统至关重要。

结论:思维的平行演化

MIT的这项研究揭示了人脑与AI在解决复杂问题时展现出的惊人相似性。虽然AI系统并非刻意模仿人类思维,但它们在问题解决方式上却自然演化出与人类相似的思维模式。

这一发现不仅丰富了我们对人工智能本质的理解,也为未来AI系统的设计和开发提供了重要启示。随着AI技术的不断发展,我们可能会看到更多这种"思维平行演化"的现象,这将推动人工智能向更接近人类认知能力的方向发展。

思考成本比较

图:人类与AI在不同类型问题上的思考成本比较