⏶2
LegalSearchLM:将法律案件检索重新思考为法律要素生成
发表
由
Chaeeun Kim 提交
作者:
Chaeeun Kim, Jinu Lee, Wonseok Hwang
摘要
法律案例检索(LCR),即从查询案例中检索相关案例,是法律专业人员在研究和决策中的一项基本任务。然而,现有关于LCR的研究面临两个主要限制。首先,它们在相对小规模的检索语料库(例如100-55K个案例)上进行评估,并且使用狭窄范围的刑事查询类型,这不足以反映现实世界法律检索场景的复杂性。其次,它们依赖于基于嵌入或词汇匹配的方法,这通常导致有限的表示和法律上不相关的匹配。为了解决这些问题,我们提出了:(1) LEGAR BENCH,第一个大规模韩语LCR基准,涵盖了超过120万个法律案例中411种不同的犯罪查询类型;以及 (2) LegalSearchLM,一个检索模型,它对查询案例执行法律要素推理,并通过受限解码直接生成基于目标案例的内容。实验结果表明,LegalSearchLM在LEGAR BENCH上比基线模型高出6-20%,达到了最先进的性能。它还展示了对域外案例的强大泛化能力,比在域内数据上训练的简单生成模型高出15%。