DeepRAG:中科院、中科大和腾讯微信AI部联合打造,颠覆传统RAG的新框架

27

在人工智能领域,大型语言模型(LLMs)正以前所未有的速度发展,它们在各种任务中展现出强大的能力,从文本生成到代码编写,无所不能。然而,这些模型并非完美无缺。一个关键的挑战在于,它们在处理需要外部知识的任务时,往往显得力不从心。为了解决这个问题,检索增强生成(RAG)技术应运而生,它通过将外部知识融入到语言模型的推理过程中,显著提升了模型的性能。

今天,我们要介绍的是一个由中科院、中科大和腾讯微信AI部联合推出的新型RAG框架——DeepRAG。它不仅仅是一个简单的检索增强工具,更是一个深度融合了检索和推理的智能系统。DeepRAG的核心在于其动态决策能力,它能够根据当前的任务状态,智能地决定何时需要检索外部知识,何时又可以依赖自身的参数知识进行推理。这种灵活性使得DeepRAG在处理复杂任务时,能够更加高效和准确。

AI快讯

DeepRAG:不仅仅是检索

与传统的RAG方法不同,DeepRAG将检索增强推理建模为一个马尔可夫决策过程(MDP)。这意味着,模型在每一步都会根据当前的状态做出决策,就像一个在棋盘上运筹帷幄的棋手。DeepRAG引入了两个关键组件:“检索叙事”和“原子决策”。检索叙事确保了检索过程的结构化和自适应性,而原子决策则控制着模型是否进行检索操作。这种动态决策机制是DeepRAG的核心优势,它使得模型能够根据任务的需要,灵活地调整检索策略。

DeepRAG的主要功能

DeepRAG的功能远不止于此,它还具备以下几个关键特性:

  • 动态检索决策:DeepRAG能够动态地决定在每一步是否需要检索外部知识,或者仅依赖模型自身的参数知识进行推理。这种动态决策能力避免了不必要的检索操作,提高了检索效率,同时减少了噪声和推理延迟。
  • 结构化检索流程:通过引入“检索叙事”,DeepRAG确保检索过程是结构化和自适应的。模型会根据之前检索到的信息生成新的子查询,逐步推进推理过程,更好地处理复杂查询。
  • 知识边界校准:DeepRAG通过“校准链”方法,帮助模型更准确地识别自身知识的边界。模型能更好地判断何时需要检索外部知识,何时可以依赖自身的知识进行推理,从而提高答案的准确性和可靠性。
  • 提高检索效率和答案准确性:实验表明,DeepRAG在多个开放域问答数据集上显著提高了答案的准确性(平均提升21.99%),同时减少了检索次数,优化了检索效率。
  • 泛化能力和鲁棒性:DeepRAG在时间敏感和分布外的问答任务中表现出良好的泛化能力和鲁棒性,能够适应不同的问答场景和数据分布。

DeepRAG的技术原理

要理解DeepRAG的强大之处,我们需要深入了解其技术原理。DeepRAG的核心在于其精妙的建模和决策机制。

  • 马尔可夫决策过程(MDP)建模:DeepRAG 将检索增强推理过程建模为 MDP,其中状态包括输入问题和到目前为止的子查询及其中间答案。模型需要做出两个关键决策:
    • 终止决策(Termination Decision):决定是否继续生成下一个子查询,或者直接生成最终答案。
    • 原子决策(Atomic Decision):决定是否检索外部知识,或者仅依赖模型的参数知识。
  • 转移(Transitions):根据动作更新状态。如果决定检索,模型会检索相关文档并生成中间答案;如果决定不检索,则直接生成中间答案。
  • 奖励(Rewards):基于答案的正确性和检索成本评估状态。奖励函数旨在最大化答案的正确性,同时最小化检索成本。
  • 二叉树搜索(Binary Tree Search):为了探索不同的检索策略,DeepRAG 使用二叉树搜索方法为每个子查询构建推理路径。对于每个子查询,模型生成两个分支:一个分支基于参数知识直接生成答案,另一个分支通过检索外部知识生成答案。通过这种方式,模型能够探索不同的检索策略,并生成从初始问题到最终答案的完整推理路径。二叉树搜索有助于分解问题,并彻底检查检索选择对最终答案的影响。
  • 模仿学习(Imitation Learning):为了让模型学习有效的检索模式,DeepRAG 采用了模仿学习的方法。模型使用优先队列高效探索潜在的推理轨迹,优先选择检索成本较低的路径。通过二叉树搜索合成数据,并提取到达正确最终答案的推理过程。然后,使用合成数据对模型进行微调,提高其终止决策和原子决策的能力,同时增强查询分解和生成可靠中间答案的能力。
  • 校准链(Chain of Calibration):为了进一步优化模型对自身知识边界的认知,DeepRAG 引入了校准链方法。该方法通过合成偏好数据来确定何时需要检索。数据基于最优路径生成,指示每个子查询的首选检索策略。使用这些偏好数据对模型进行微调,增强其基于内部知识边界的原子决策能力。通过校准链方法,模型能够更准确地识别何时需要检索外部知识,何时可以依赖自身的知识进行推理。

DeepRAG的应用场景

DeepRAG 的应用前景非常广阔,它可以应用于各种需要知识增强的场景。

  • 开放域问答:DeepRAG 能够处理复杂的多跳问答任务,通过逐步分解问题并动态检索相关信息,生成准确的答案。
  • 知识库问答:在知识库问答中,DeepRAG 可以结合外部知识库(如维基百科)和模型自身的知识,提供更准确的答案。
  • 智能客服与虚拟助手:DeepRAG 可以应用于智能客服系统,通过动态检索和推理,提供更准确、更及时的客户支持。
  • 教育与学习辅助:在教育领域,DeepRAG 可以帮助学生和教师获取更准确的知识和信息。它可以根据学生的学习进度和需求,动态生成学习材料和练习题。
  • 医疗健康咨询:DeepRAG 可以用于医疗健康咨询,通过检索最新的医学研究和临床指南,提供准确的健康建议。

DeepRAG的价值与意义

DeepRAG 的出现,为大型语言模型的发展带来了新的可能性。它不仅仅是一个技术突破,更是一种思维方式的转变。它告诉我们,要让AI更好地服务于人类,我们需要将外部知识与模型自身的智能相结合,让AI具备更强的推理能力和适应性。DeepRAG 的成功,也为未来的AI研究指明了方向:我们需要更加注重模型的动态决策能力,让AI能够根据不同的任务和环境,灵活地调整自身的策略。

随着AI技术的不断发展,我们有理由相信,DeepRAG 将会在更多的领域发挥重要作用,为人类带来更多的便利和价值。让我们拭目以待,共同见证DeepRAG 的未来。

DeepRAG的项目地址