🚀 百度文心大模型4.5 & X1重磅发布:多模态能力再升级,免费开放体验!

7

百度文心大模型迎来重大升级

文心大模型4.5

2025年3月16日,百度正式发布文心大模型4.5和文心大模型X1。这两款全新大模型不仅在多模态能力上实现了显著提升,还具备更强的语言能力、逻辑推理能力和代码能力。更令人振奋的是,这两款模型已在文心一言官网免费向用户开放,企业用户和开发者也可以通过百度智能云千帆大模型平台调用API。

一、 文心大模型4.5:原生多模态基础大模型

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型。它通过多个模态联合建模实现协同优化,具备出色的多模态理解能力。同时,文心大模型4.5在语言能力方面也进行了全面升级,理解、生成、逻辑、记忆能力均得到显著提升,去幻觉、逻辑推理和代码能力也得到了加强。

1. 多模态能力:

多模态能力

文心大模型4.5能够综合理解文字、图片、音频、视频等多种模态的内容。无论是复杂的图表分析,还是蕴含深意的网络梗图,文心大模型4.5都能准确理解并给出详细的解释。

例如,在处理一道包含图表和文字的数学题时,文心大模型4.5能够准确提取图表中的关键信息,并结合文字描述,给出详细的解题步骤和选项分析。

对于网络上流行的梗图,文心大模型4.5不仅能理解其表面的含义,还能深入分析其背后的文化背景和逻辑关系,展现出强大的“情商”。

2. 文本能力

除了多模态能力,文心大模型4.5的文本能力也得到了显著提升。理解、生成、逻辑、记忆是构成强大语言能力的关键,而4.5对这些都做到了提升。

3. 关键技术

文心大模型4.5的能力提升,离不开以下关键技术的支撑:

  • FlashMask动态注意力掩码: 加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现。
  • 多模态异构专家扩展技术: 根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力。
  • 时空维度表征压缩技术: 在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力。
  • 基于知识点的大规模数据构建技术: 基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉。
  • 基于自反馈的Post-training技术: 融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。

二、 文心大模型X1:能力更全面的深度思考模型

文心大模型X1是一款能力更全面的深度思考模型。它具备更强的理解、规划、反思和进化能力,并支持多模态。更重要的是,文心大模型X1是首个自主运用工具的深度思考模型。

文心大模型X1在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

1. 自主运用工具

文心大模型X1能够自主调用多种工具,包括高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等。

例如,在让文心大模型X1使用中国各朝代历史人物典故替换《寒窑赋》原文中的事例时,它展现出了清晰的思维链:

  1. 找到和原文相似的人物典故。
  2. 注意文风和句式。
  3. 检查人物典故的适配度。
  4. 行文保持结构流畅。

最终,文心大模型X1生成了和原文立意、文风句式都基本一致的文本。

2. 关键技术

文心大模型X1的能力提升,得益于以下关键技术的支撑:

  • 递进式强化学习训练方法: 创新性地应用递进式强化学习方法,在创作、搜索、工具调用、推理等场景全面提升模型的综合应用能力。
  • 基于思维链和行动链的端到端训练: 针对深度搜索、工具调用等场景,根据结果反馈进行端到端的模型训练,显著提升训练效果。
  • 多元统一的奖励系统: 建立了统一的奖励系统,融合多种类型的奖励机制,为模型训练提供更加鲁棒的反馈。

三、 百度:持续投入,打造更智能的下一代模型

百度表示,2025年是大模型技术全面迭代的一年,百度将在人工智能、数据中心、云基础设施上更大胆地投入,打造更好、更智能的下一代模型。

文心大模型,开启AI应用新篇章

百度文心大模型4.5和文心大模型X1的发布,标志着百度在AI领域又迈出了坚实的一步。这两款模型的强大能力和免费开放的策略,将进一步推动AI技术的普及和应用,为各行各业带来更多的创新和变革。