⏶7
Agentar-Fin-R1: 通过领域专业知识、训练效率和高级推理,提升金融智能
发表
由
Adina Yakefu 提交

作者: Yanjun Zheng, Xiyang Du, Longfei Liao, Xiaoke Zhao, Zhaowen Zhou, Jingze Song, Bo Zhang, Jiawei Liu, Xiang Qi, Zhe Li, Zhiqiang Zhang, Wei Wang, Peng Zhang
摘要
大语言模型(LLM)在金融应用中展现出巨大的潜力;然而,现有模型在面对需要复杂推理能力、严格可信度标准以及高效适应领域特定需求的场景时,经常表现出局限性。我们推出了Agentar-Fin-R1系列金融大语言模型(80亿和320亿参数),该系列模型基于Qwen3基座模型进行专门设计,旨在提升金融应用的推理能力、可靠性和领域专业性。我们的优化方法整合了高质量、系统化的金融任务标签体系与全面多层可信度保障框架。该框架涵盖了高质量可信知识工程、多智能体可信数据合成以及严格的数据验证治理。通过标签引导的自动化难度感知优化、两阶段训练流程和动态归因系统,我们显著提升了训练效率。我们的模型在Fineva、FinEval和FinanceIQ等主流金融基准测试以及MATH-500和GPQA-diamond等通用推理数据集上进行了全面评估。为了全面评估实际部署能力,我们创新性地提出了Finova评估基准,该基准专注于智能体级金融推理和合规性验证。实验结果表明,Agentar-Fin-R1不仅在金融任务上取得了最先进的性能,而且展现出卓越的通用推理能力,验证了其作为高风险金融应用中可信赖解决方案的有效性。Finova基准可在https://github.com/antgroup/Finova获取。

Agentar-Fin-R1:通过领域专业知识、训练效率和高级推理提升金融智能