交互式训练:面向反馈的神经网络优化

发表
Yuntian DengYuntian Deng 提交
作者: Wentao Zhang, Yang Young Lu, Yuntian DengYuntian Deng

摘要

AI 生成总结
交互式训练是一个允许在神经网络训练过程中进行实时、反馈驱动干预的框架,提高了稳定性和适应性。
传统的神经网络训练通常遵循固定、预定义的优化方案,缺乏动态响应不稳定或新兴训练问题的灵活性。在本文中,我们介绍了交互式训练(Interactive Training),这是一个开源框架,可以实现由人类专家或自动人工智能代理在神经网络训练期间进行实时、反馈驱动的干预。交互式训练的核心是使用一个控制服务器来协调用户或代理与正在进行的训练过程之间的通信,允许用户动态调整优化器超参数、训练数据和模型检查点。通过三个案例研究,我们证明了交互式训练在训练稳定性、对初始超参数的敏感性降低以及对不断变化的用户需求的适应性提高方面取得了优越的性能,为人工智能代理自主监控训练日志、主动解决不稳定问题和优化训练动态的未来训练范式铺平了道路。
查看 arXiv 页面查看 PDF
交互式训练:面向反馈的神经网络优化

评论

Yuntian DengYuntian Deng
论文作者
论文提交者

每次我观看模型训练时,我都希望能够实时调整学习率。 这就像烹饪一样:当食物闻起来不对时,我们会调整旋钮。

我们构建了交互式训练,正是为了做到这一点,将单向的损失监控转变为双向的交互。

Yuntian DengYuntian Deng
论文作者
论文提交者

交互式训练前端仪表板。左侧面板提供按优化器、模型、检查点和数据集组织的控制选项卡,允许用户在训练过程中动态发送干预命令(例如,通过显示的优化器面板调整学习率)。右侧显示训练指标的实时可视化,例如损失和梯度范数。与传统的监控工具不同,该界面支持主动的双向通信,使用户能够实时直接干预和影响正在进行的训练过程。 dashboard