⏶4
用于5G无线网络根本原因分析的推理语言模型
发表
由
Nicola Piovesan 提交

作者: Mohamed Sana,
Nicola Piovesan, Antonio De Domenico, Yibin Kang, Haozhe Zhang, Merouane Debbah, Fadhel Ayed

摘要
由于需要可解释性、领域专业知识和因果推理,移动网络中的根本原因分析(RCA)仍然是一项具有挑战性的任务。在这项工作中,我们提出了一种轻量级框架,该框架利用大型语言模型(LLM)进行RCA。为此,我们引入了TeleLogs,这是一个经过整理的、带有注释的故障排除问题数据集,旨在对RCA能力进行基准测试。我们的评估显示,现有的开源推理LLM在这些问题上表现不佳,这凸显了领域特定适应的必要性。为了解决这个问题,我们提出了一种两阶段训练方法,该方法将有监督微调与强化学习相结合,以提高LLM的准确性和推理质量。所提出的方法对一系列RCA模型进行微调,以整合领域知识并生成结构化的、多步骤的诊断解释,从而提高可解释性和有效性。在多种LLM规模上进行的广泛实验表明,与最先进的推理和非推理模型相比,性能显著提高,包括对随机测试变体的强大泛化能力。这些结果证明了领域适应的、推理增强的LLM在网络运营和管理中进行实用且可解释的RCA的潜力。
我们提出了一种基于推理LLMs的轻量级根本原因分析框架,该框架使用监督学习和强化学习的混合方式在TeleLogs数据集上进行训练。我们的方法在使用Qwen2.5-32B-Instruct时实现了超过95%的准确率,并优于强基线,显示出在复杂网络场景中实现可解释的、LLM驱动的诊断的潜力。