蚂蚁数科发布Agentar-Fin-R1:如何重塑金融AI应用格局?

1

在2025世界人工智能大会上,蚂蚁数科发布了金融推理大模型Agentar-Fin-R1,旨在为金融AI应用打造一个“可靠、可控、可优化”的智能中枢。这款大模型基于Qwen3研发,并在FinEval1.0、FinanceIQ等权威金融大模型评测基准上,超越了Deepseek-R1等同尺寸开源通用大模型以及其他金融大模型,展现出更强的金融专业性、推理能力以及安全合规能力。

2a5af2d265b03cc30169ed65b9b6819.jpg

随着金融行业数智化转型的加速,大模型在金融领域的应用日益深化。然而,实际业务场景对专业金融知识、复杂业务逻辑推理以及严格的金融级安全合规提出了更高要求。现有的大模型在解决实际金融任务时,仍然面临诸多挑战。

蚂蚁数科CEO赵闻飙在演讲中指出,通用大模型与产业实际应用之间存在“知识鸿沟”。构建专业的金融大模型是推动金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。

蚂蚁数科通过构建全面的金融任务数据体系以及模型训练算法创新,实现了模型更强的金融推理能力及可信性。评测结果显示,相较于通用开源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ两大主流金融基准测试中均取得了最高评分。值得一提的是,该模型在金融能力显著增强的同时,通用能力也表现出较高水准。

image.png

在数据层面,蚂蚁数科构建了业内全面且专业的金融任务分类体系,涵盖银行、证券、保险、基金、信托等金融全场景,共计6大类、66小类场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升了模型处理复杂任务的能力,实现了大模型“天生懂金融,出厂即专家”。

在训练层面,蚂蚁数科采用了创新的加权训练算法,提高了大模型对复杂金融任务的学习效率与性能。在后续业务应用中,该算法可显著减少二次微调的数据需求与算力消耗,有效降低了大模型在企业落地的门槛与成本。此外,Agentar-Fin-R1还具备不断更新迭代的能力,能够吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,从而在真实业务场景中不断进化。

Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出了基于百灵大模型的MOE架构模型,以获得更优的推理速度。此外,还有非推理版本的14B和72B参数大模型,旨在满足金融机构在多样化场景下的部署需求。

a7023fd4b700862241744938cd9940d.png

为了评估大模型在实际金融场景中的部署能力,蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构,共同推出了Finova大模型金融应用评测基准,旨在深度考察智能体能力、复杂推理以及安全合规能力。在Finova评测中,Agentar-Fin-R1同样取得了最高评分,甚至超越了更大参数规模的通用模型。目前,Finova已经全面开源,以推动行业共同提升大模型在金融领域的应用水平。

蚂蚁数科作为蚂蚁集团旗下的独立科技子公司,致力于以AI及Web3技术助力产业数智化升级。今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。在金融领域,蚂蚁数科此前推出了金融智能体平台Agentar,成为首批通过信通院评测的智能体平台产品,并获最高评级5级。此外,蚂蚁数科还联合行业合作伙伴,推出了超百个金融智能体解决方案,以加速大模型在金融业的规模化应用。

以上海某银行为例,蚂蚁数科助力该银行打造的AI手机银行,创新性地采用了“对话即服务”模式,用户通过自然对话即可获取各类金融服务,显著提升了银行老年客户的满意度,并实现了月活用户同比增长25%。截至目前,蚂蚁数科已累计服务100%的国有银行和股份制银行、超过60%的地方性商业银行以及数百家金融机构。

蚂蚁数科Agentar-Fin-R1大模型的技术创新与应用前景

蚂蚁数科Agentar-Fin-R1大模型的发布,标志着金融行业在人工智能应用方面迈出了重要一步。该模型不仅在多个权威金融大模型评测基准上表现出色,还在实际应用中展现出了强大的潜力。本文将深入探讨Agentar-Fin-R1的技术创新,并分析其在金融领域应用的前景。

技术创新

  1. 全面的金融任务数据体系

Agentar-Fin-R1的成功离不开蚂蚁数科构建的全面金融任务数据体系。该体系涵盖了银行、证券、保险、基金、信托等金融全场景,共计6大类、66小类场景。这种全面的数据覆盖为模型提供了丰富的学习资源,使其能够更好地理解和处理各种金融任务。

  1. 可信数据合成技术与金融长思维链

为了进一步提升模型的性能,蚂蚁数科采用了可信数据合成技术,并结合专家标注的金融长思维链(CoT)构造机制。这些技术手段显著提升了模型处理复杂任务的能力,使其能够像金融专家一样思考和解决问题。

  1. 创新的加权训练算法

在模型训练过程中,蚂蚁数科采用了创新的加权训练算法,提高了大模型对复杂金融任务的学习效率与性能。这种算法能够根据任务的复杂程度调整权重,使模型更加关注重要的知识点。

  1. 持续更新迭代的能力

Agentar-Fin-R1具备不断更新迭代的能力,能够吸收最新的金融政策、市场动态等关键信息。通过配套的评测工具,模型可以进行针对性优化,从而在真实业务场景中不断进化。

应用前景

  1. 提升金融服务效率与质量

Agentar-Fin-R1可以应用于智能客服、风险评估、投资顾问等多个金融场景,从而提升金融服务的效率与质量。例如,在智能客服场景中,Agentar-Fin-R1可以根据用户的提问,快速准确地提供答案,减少人工客服的工作量。

  1. 降低金融机构的运营成本

通过自动化处理大量的金融任务,Agentar-Fin-R1可以帮助金融机构降低运营成本。例如,在风险评估场景中,Agentar-Fin-R1可以自动分析大量的金融数据,识别潜在的风险,减少人工审核的工作量。

  1. 促进金融普惠化

Agentar-Fin-R1可以为更多的用户提供金融服务,尤其是在偏远地区或金融服务不发达地区。通过AI手机银行等创新应用,用户可以随时随地获取金融服务,无需前往银行网点。

  1. 推动金融创新

Agentar-Fin-R1的强大能力为金融创新提供了新的可能性。金融机构可以利用Agentar-Fin-R1开发出各种创新的金融产品和服务,满足用户的多样化需求。

面临的挑战与应对策略

尽管Agentar-Fin-R1具有广阔的应用前景,但在实际应用中仍面临一些挑战。本文将分析这些挑战,并提出相应的应对策略。

挑战

  1. 数据安全与隐私保护

金融数据涉及用户的个人信息和财产安全,因此数据安全与隐私保护是金融AI应用面临的重要挑战。如何确保数据的安全性和隐私性,防止数据泄露和滥用,是金融机构需要认真考虑的问题。

  1. 模型的可解释性与可信度

金融决策往往需要充分的理由和依据,因此模型的可解释性与可信度至关重要。如果模型做出的决策无法解释,用户和监管机构可能难以信任该模型。

  1. 监管合规

金融行业受到严格的监管,金融AI应用必须符合相关的法律法规。如何确保模型符合监管要求,避免违规行为,是金融机构需要重点关注的问题。

应对策略

  1. 加强数据安全防护

金融机构应加强数据安全防护,采用各种技术手段保护数据的安全性和隐私性。例如,可以采用加密技术保护数据的传输和存储,采用访问控制技术限制对数据的访问。

  1. 提高模型的可解释性

金融机构应努力提高模型的可解释性,使模型做出的决策能够被理解和解释。例如,可以采用可解释的机器学习算法,或者通过可视化技术展示模型的决策过程。

  1. 建立完善的合规体系

金融机构应建立完善的合规体系,确保金融AI应用符合相关的法律法规。例如,可以设立专门的合规部门,负责审核和监督金融AI应用的合规性。

  1. 提升模型在复杂推理和安全合规上的能力

    通过Finova大模型金融应用评测基准,蚂蚁数科与多家机构合作,旨在考察大模型在实际金融场景中部署的能力,深度考察智能体能力、复杂推理以及安全合规能力。通过这种方式推动行业共同提升大模型在金融领域的应用水平。

结论

蚂蚁数科Agentar-Fin-R1大模型在金融领域的应用具有广阔的前景,但也面临一些挑战。只有通过不断的技术创新和完善的风险管理措施,才能充分发挥Agentar-Fin-R1的潜力,为金融行业带来更大的价值。未来的金融机构竞争,将不仅在于技术,更在于如何将技术与业务深度融合,创造出真正满足用户需求的创新服务。