⏶0
当可解释性遇上隐私:在自然语言处理背景下对后验可解释性和差分隐私交叉点的研究
发表
由
Mahdi Dhaini 提交
作者:
Mahdi Dhaini, Stephen Meisenbacher, Ege Erdogan, Florian Matthes, Gjergji Kasneci
摘要
在可信赖自然语言处理 (NLP) 的研究中,出现了许多重要的研究领域,包括可解释性和隐私。尽管近年来对可解释和隐私保护 NLP 的研究兴趣显着增加,但这两个交叉领域仍缺乏调查。这导致在理解是否可以同时实现可解释性和隐私,或者两者是否相互矛盾方面存在相当大的空白。在这项工作中,我们在 NLP 的背景下,以差分隐私 (DP) 和事后可解释性等流行的总体方法为指导,对隐私-可解释性权衡进行了实证研究。我们的研究结果包括对隐私和可解释性之间复杂关系的看法,该关系由多种因素形成,包括下游任务的性质以及文本隐私化和可解释性方法的选择。在此,我们强调了隐私和可解释性共存的可能性,并总结了我们的发现,为这一重要交叉领域的未来工作提供了实用建议。
已被 AAAI/ACM 人工智能、伦理与社会会议 (AIES 2025) 接收