⏶34
爱马仕 4 技术报告
发表
由
Sumuk Shashidhar 提交

作者:
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan,
Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra


摘要
我们提出了 Hermes 4,这是一个混合推理模型系列,结合了结构化、多轮推理与广泛的指令遵循能力。我们描述了在数据策选、合成、训练和评估过程中遇到的挑战,并概述了为大规模解决这些挑战所采用的解决方案。我们全面评估了数学推理、编码、知识、理解和对齐基准测试,并报告了定量性能和定性行为分析。为了支持开放研究,所有模型权重均公开发布在
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
前进,NOUS!