⏶2
稀疏数据,丰富结果:通过类别条件图像翻译实现少样本半监督学习
发表
由
Guido Manni 提交

作者:
Guido Manni, Clemente Lauretti, Loredana Zollo, Paolo Soda

摘要
深度学习彻底改变了医学影像领域,但其有效性受到标记训练数据不足的严重限制。本文介绍了一种新颖的基于GAN的半监督学习框架,专门为标记数据量少的场景设计,并在每个类别5到50个标记样本的设置下进行评估。我们的方法在一个三阶段训练框架中集成了三个专门的神经网络:一个用于类别条件图像翻译的生成器,一个用于真实性评估和分类的判别器,以及一个专门的分类器。该方法在有限标记数据上的监督训练和利用大量未标记图像通过图像到图像翻译而非从噪声生成进行无监督学习之间交替进行。我们采用基于集成学习的伪标记方法,结合了判别器和分类器置信度加权的预测,并通过指数移动平均实现时间一致性,从而能够对未标记数据进行可靠的标签估计。对十一个MedMNIST数据集的综合评估表明,我们的方法在六种最先进的基于GAN的半监督方法上实现了统计学上的显著改进,尤其是在极端5样本设置下表现出色,因为标记数据稀缺性最具挑战性。该框架在所有评估设置(每个类别5、10、20和50样本)中均保持其优越性。我们的方法为标注成本高昂的医学影像应用提供了实用的解决方案,即使只有最少的标记数据也能实现稳健的分类性能。代码可在https://github.com/GuidoManni/SPARSE获取。
深度学习彻底改变了医学影像领域,但其有效性受到标记训练数据不足的严重限制。本文提出了一种新颖的基于 GAN 的半监督学习框架,专门为标记数据量低的场景设计,并在每个类别 5 到 50 个标记样本的设置下进行了评估。我们的方法在三阶段训练框架内集成了三个专门的神经网络:一个用于类别条件图像转换的生成器、一个用于真实性评估和分类的判别器以及一个专用分类器。该方法在有限标记数据上的监督训练和利用大量未标记图像的无监督学习之间交替进行,其中无监督学习通过图像到图像的转换而非从噪声生成来实现。我们采用基于集成的伪标签方法,该方法结合了来自判别器和分类器的置信度加权预测,并通过指数移动平均实现时间一致性,从而为未标记数据提供可靠的标签估计。对十一个 MedMNIST 数据集的综合评估表明,我们的方法在六种最先进的基于 GAN 的半监督方法上取得了统计学上的显著改进,特别是在极端的 5-shot 设置中表现出色,在这种设置下,标记数据的稀缺性最具挑战性。该框架在所有评估设置(每个类别 5、10、20 和 50 shot)中都保持了其优越性。我们的方法为标注成本高昂的医学影像应用提供了实用解决方案,即使标记数据量极少也能实现鲁棒的分类性能。