SciReasoner: 奠定跨学科的科学推理基础

发表
taesiritaesiri 提交
作者: Yizhou WangYizhou Wang, Chen Tang, Han Deng, Jiabei Xiao, Jiaqi Liu, Jianyu WuJianyu Wu, Jun Yao, Pengze Li, Encheng SuEncheng Su, Lintao Wang, Guohang ZhuangGuohang Zhuang, Yuchen Ren, Ben Fei, Ming Hu, Xin Chen, Dongzhan Zhou, Junjun He, Xiangyu YueXiangyu Yue, Zhenfei YinZhenfei Yin, Jiamin Wu, Qihao Zheng, Yuhao Zhou, Huihui Xu, Chenglong MaChenglong Ma, Yan Lu, Wenlong Zhang, Chunfeng Song, Philip Torr, SHIXIANG TANGShixiang Tang, xinzhumaXinzhu Ma, Wanli Ouyang, Lei Bai

摘要

AI 生成总结
一个在各种科学数据上预训练的科学推理基础模型,通过专门的训练技术支持多种任务,并增强了跨领域泛化和保真度。
我们提出了一个科学推理基础模型,该模型将自然语言与异构科学表示对齐。该模型在包含科学文本、纯序列和序列-文本对的206B token语料库上进行了预训练,然后通过SFT在40M指令上进行对齐,退火冷启动引导以引出长篇思维链,并通过具有任务特定奖励塑造的强化学习进行训练,从而灌输了深思熟虑的科学推理。它支持四种能力家族,涵盖了工作流中的多达103个任务:(i)文本与科学格式之间的忠实翻译;(ii)文本/知识提取;(iii)属性预测;(iv)属性分类;(v)无条件和有条件的序列生成与设计。与专业系统相比,我们的方法拓宽了指令覆盖范围,提高了跨域泛化能力,并增强了保真度。我们详细介绍了数据策划和训练,并表明跨学科学习可以增强迁移和下游可靠性。该模型、指令调优数据集和评估代码在https://huggingface.co/SciReasonhttps://github.com/open-sciencelab/SciReason 上开源。
查看 arXiv 页面查看 PDF

评论

taesiritaesiri
论文提交者

SciReasoner:跨学科科学推理基础