⏶3
是否存在偏见:使用 bias-detector 检测新闻中的偏见
发表
由
Himel Ghosh 提交
作者:
Himel Ghosh,
Ahmed Mosharafa,
Georg Groh
摘要
媒体偏见检测是确保信息公平和平衡传播的关键任务,但由于偏见的主观性以及高质量标注数据的稀缺性,这项任务仍然充满挑战。在这项工作中,我们通过在专家标注的 BABE 数据集上微调基于 RoBERTa 的模型,来进行句子级偏见分类。使用 McNemar 检验和 5x2 交叉验证配对 t 检验,我们证明了与领域自适应预训练的 DA-RoBERTa 基线模型相比,我们的模型在性能上实现了统计学上显著的提升。此外,基于注意力的分析表明,我们的模型避免了过度关注带有政治色彩的词汇等常见陷阱,而是更有意义地关注上下文相关的词元。为了全面检测媒体偏见,我们提出了一个将我们的模型与现有偏见类型分类器相结合的流水线。尽管受限于句子级分析和数据集大小(由于缺乏更大、更先进的偏见语料库),我们的方法表现出良好的泛化能力和可解释性。我们讨论了上下文感知建模、偏见中和以及高级偏见类型分类作为潜在的未来方向。我们的研究结果有助于构建更鲁棒、更具解释性、更具社会责任感的媒体偏见检测自然语言处理系统。

本文介绍了 Hugging Face 上提供的句子级偏差检测模型 himel7/bias-detector,用于新闻文章的偏差检测。