⏶1
使用 MIDI-RWKV 实现可个性化的长上下文符号音乐填充
发表
由
Christian Zhou-Zheng 提交

作者:
Christian Zhou-Zheng,
Philippe Pasquier


摘要
现有自动音乐生成的研究主要集中于生产完整作品或续作的端到端系统。然而,由于音乐创作通常是一个迭代过程,此类系统难以实现人机之间的来回互动,而这对于计算机辅助创意至关重要。在这项研究中,我们着手解决个性化、多轨、长上下文和可控的符号音乐填充任务,以增强计算机辅助作曲过程。我们提出了 MIDI-RWKV,一个基于 RWKV-7 线性架构的新模型,旨在实现边缘设备上高效且连贯的音乐协同创作。我们还证明了 MIDI-RWKV 允许在极低样本量的情况下,有效微调其初始状态以实现个性化。我们在多项定量和定性指标上评估了 MIDI-RWKV 及其状态调优,并在 https://github.com/christianazinn/MIDI-RWKV 发布了模型权重和代码。
我们提出了一个新模型,基于RWKV-7,用于长上下文音乐填充以及一种新颖的微调方案!我们将在该方向上进行更多工作,包括更好/更大的模型以及更多的评估和比较,敬请期待!