RedOne:揭示社交网络服务中的领域特定LLM后训练

发表
Fei ZhaoFei Zhao 提交
作者: Fei ZhaoFei Zhao, Chonggang LuChonggang Lu, Yue Wang, Zheyong Xie, Ziyan Liu, Haofu Qian, Jianzhao HuangJianZhao Huang, Fangcheng Shi, Zijie Meng, Hongcheng Guo, Mingqian He, Xinze Lyu, Yiming Lu, Ziyang Xiang, Zheyu Ye, Chengqiang Lu, Zhe Xu, Yi Wu, Yao Hu, Yan Gao, Jun Fan, Xiaolong Jiang, Weiting Liu, Boyang Wang, Shaosheng Cao

摘要

作为现代信息传播的主要媒介,社交网络服务(SNS)经历了快速增长,这也为平台内容管理和互动质量提升带来了严峻挑战。近期,大型语言模型(LLM)的发展提供了潜在解决方案,但现有研究侧重于孤立任务,这不仅在单个场景内的数据扩展中遇到效益递减的问题,而且未能灵活适应多样化的真实世界语境。为应对这些挑战,我们引入了RedOne,一个领域特定的LLM,旨在打破单任务基线的性能瓶颈,并为SNS建立一个全面的基础。RedOne是利用大规模真实世界数据集,通过持续预训练、监督微调和偏好优化三阶段训练策略开发的。通过大量实验,RedOne保持了强大的通用能力,与基准模型相比,在8个主要SNS任务中平均性能提升高达14.02%,在SNS双语评估基准中提升7.56%。此外,通过在线测试,与单任务微调基准模型相比,RedOne将有害内容检测中的曝光率降低了11.23%,并将帖子浏览搜索中的点击页面率提高了14.95%。这些结果表明RedOne是一个稳健的SNS领域特定LLM,在各种任务中展现出卓越的泛化能力,并在真实世界场景中具有广阔的适用前景。
查看 arXiv 页面查看 PDF

评论

Fei ZhaoFei Zhao
论文作者
论文提交者

揭示社交网络服务背景下领域特定大语言模型后训练的深入研究

syGOATsyGOAT

这似乎是领域特定型LLM的典范。