EasySteer:统一的高性能、可扩展LLM引导框架

发表
xhlxhl 提交
作者: xhlHaolei Xu, Xinyu MeiXinyu Mei, Yuchen YanYuchen Yan, Rui Zhou, Wenqi Zhang, Weiming Lu, Yueting Zhuang, Yongliang ShenYongliang Shen

摘要

AI 生成总结
EasySteer 是一个用于高效可扩展地控制大型语言模型的统一框架,与现有方法相比,它提供了显著的速度提升和改进的功能。
大型语言模型 (LLM) 的引导已成为一种有前途的范式,通过对隐藏状态进行有针对性的操纵来控制模型在推理时的行为,从而提供了一种轻量级的替代昂贵的重新训练方法。然而,现有的引导框架存在关键限制:计算效率低下、可扩展性有限以及功能受限,这阻碍了研究进展和实际部署。我们提出了 EasySteer,一个基于 vLLM 构建的高性能、可扩展 LLM 引导的统一框架。我们的系统具有模块化架构,具有用于基于分析和基于学习方法的即插即用接口、细粒度参数控制、针对八个应用领域的预计算引导向量以及一个交互式演示系统。通过与 vLLM 的优化推理引擎深度集成,EasySteer 比现有框架实现了 5.5-11.4 倍的速度提升。广泛的实验证明了其在过度思考缓解、幻觉减少和其他关键应用中的有效性。EasySteer 将引导从研究技术转变为生产就绪的功能,为可部署、可控的语言模型奠定了关键基础设施。
查看 arXiv 页面查看 PDF

评论

xhlxhl
论文作者
论文提交者

我们很高兴推出 EasySteer:一个统一的高性能、可扩展的 LLM 控制框架。Github:https://github.com/ZJU-REAL/EasySteer