🚀 百度文心大模型4.5 & X1重磅发布：多模态能力再升级，免费开放体验！

文心大模型4.5

2025年3月16日，百度正式发布文心大模型4.5和文心大模型X1。这两款全新大模型不仅在多模态能力上实现了显著提升，还具备更强的语言能力、逻辑推理能力和代码能力。更令人振奋的是，这两款模型已在文心一言官网免费向用户开放，企业用户和开发者也可以通过百度智能云千帆大模型平台调用API。

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型。它通过多个模态联合建模实现协同优化，具备出色的多模态理解能力。同时，文心大模型4.5在语言能力方面也进行了全面升级，理解、生成、逻辑、记忆能力均得到显著提升，去幻觉、逻辑推理和代码能力也得到了加强。

多模态能力

文心大模型4.5能够综合理解文字、图片、音频、视频等多种模态的内容。无论是复杂的图表分析，还是蕴含深意的网络梗图，文心大模型4.5都能准确理解并给出详细的解释。

例如，在处理一道包含图表和文字的数学题时，文心大模型4.5能够准确提取图表中的关键信息，并结合文字描述，给出详细的解题步骤和选项分析。

对于网络上流行的梗图，文心大模型4.5不仅能理解其表面的含义，还能深入分析其背后的文化背景和逻辑关系，展现出强大的“情商”。

除了多模态能力，文心大模型4.5的文本能力也得到了显著提升。理解、生成、逻辑、记忆是构成强大语言能力的关键，而4.5对这些都做到了提升。

文心大模型4.5的能力提升，离不开以下关键技术的支撑：

FlashMask动态注意力掩码： 加速大模型灵活注意力掩码计算，有效提升长序列建模能力和训练效率，优化长文处理能力和多轮交互表现。
多模态异构专家扩展技术： 根据模态特点构建模态异构专家，结合自适应模态感知损失函数，解决不同模态梯度不均衡问题，提升多模态融合能力。
时空维度表征压缩技术： 在时空维度对图片和视频的语义表征进行高效压缩，大幅提升多模态数据训练效率，增强了从长视频中吸取世界知识的能力。
基于知识点的大规模数据构建技术： 基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术，构建高知识密度预训练数据，提升模型学习效率，大幅降低模型幻觉。
基于自反馈的Post-training技术： 融合多种评价方式的自反馈迭代式后训练技术，全面提升强化学习稳定性和鲁棒性，大幅提升预训练模型对齐人类意图能力。

文心大模型X1是一款能力更全面的深度思考模型。它具备更强的理解、规划、反思和进化能力，并支持多模态。更重要的是，文心大模型X1是首个自主运用工具的深度思考模型。

文心大模型X1在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

文心大模型X1能够自主调用多种工具，包括高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等。

例如，在让文心大模型X1使用中国各朝代历史人物典故替换《寒窑赋》原文中的事例时，它展现出了清晰的思维链：

最终，文心大模型X1生成了和原文立意、文风句式都基本一致的文本。

文心大模型X1的能力提升，得益于以下关键技术的支撑：

百度表示，2025年是大模型技术全面迭代的一年，百度将在人工智能、数据中心、云基础设施上更大胆地投入，打造更好、更智能的下一代模型。

百度文心大模型4.5和文心大模型X1的发布，标志着百度在AI领域又迈出了坚实的一步。这两款模型的强大能力和免费开放的策略，将进一步推动AI技术的普及和应用，为各行各业带来更多的创新和变革。