“这不是我的代表”:检查合成 AI 语音服务中的口音偏见和数字排斥

发表
Avijit GhoshAvijit Ghosh 提交
作者: Shira MichelShira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit GhoshAvijit Ghosh

摘要

人工智能 (AI) 语音生成和声音克隆技术的最新进展已经产生了自然的语音和准确的声音复制,但它们对跨不同口音和语言特征的社会技术系统的影响尚未完全理解。本研究通过混合方法,使用调查和访谈评估了两种合成 AI 语音服务(Speechify 和 ElevenLabs)的技术性能,并揭示了用户的生活经验如何影响他们对这些语音技术中口音变化的感知。我们的研究结果揭示了五种地区性英语口音的技术性能差异,并表明当前的语音生成技术可能会在无意中加强语言特权和基于口音的歧视,从而可能产生新的数字排斥形式。总的来说,我们的研究强调了包容性设计和监管的必要性,为开发人员、政策制定者和组织提供可操作的见解,以确保公平和对社会负责任的 AI 语音技术。
查看 arXiv 页面查看 PDF

评论

Avijit GhoshAvijit Ghosh
论文作者
论文提交者

请告诉我们您的想法!