ProtoGCD:用于广义类别发现的统一且无偏的原型学习

04月02日发表
04月09日由 Shijie MaShijie Ma 提交
作者: Shijie MaShijie Ma, Fei Zhu, Xu-Yao Zhang, Chenglin LiuCheng-Lin Liu

摘要

广义类别发现 (GCD) 是一个务实但尚未充分探索的问题,它要求模型通过利用旧类别的标记样本来自动聚类和发现新类别。挑战在于,未标记的数据包含旧类别和新类别。早期利用参数分类器进行伪标记的工作分别处理旧类别和新类别,这导致它们之间的准确性不平衡。最近采用对比学习的方法忽略了潜在的阳性样本,并且与聚类目标脱钩,从而导致有偏差的表示和次优结果。为了解决这些问题,我们引入了一个统一且无偏的原型学习框架,即 ProtoGCD,其中旧类别和新类别使用联合原型和统一的学习目标进行建模,{从而实现旧类别和新类别之间的统一建模}。具体而言,我们提出了一种双层自适应伪标记机制,以减轻确认偏差,并结合两个正则化项,以共同帮助学习更适合 GCD 的表示。此外,出于实际考虑,我们设计了一个标准来估计新类别的数量。此外,我们将 ProtoGCD 扩展到检测未见过的异常值,从而实现任务级别的统一。全面的实验表明,ProtoGCD 在通用和细粒度数据集上都取得了最先进的性能。代码可在 https://github.com/mashijie1028/ProtoGCD 上获取。

评论

Shijie MaShijie Ma
论文作者
论文提交者

TPAMI 2025