UKBOB:十亿MRI标记掩码,用于可泛化的3D医学图像分割

发表
Niels RoggeNiels Rogge 提交
作者: Emmanuelle Bourigault, Amir Jamaludin, Abdullah Hamdi

摘要

在医学影像中,由于隐私问题、后勤和高昂的标记成本,主要挑战是收集大规模标记数据。在这项工作中,我们介绍了英国生物样本库器官和骨骼 (UKBOB),这是最大的身体器官标记数据集,包含 51,761 个 MRI 3D 样本(相当于 1790 万张 2D 图像)和超过 13.7 亿个 2D 分割掩码,涵盖 72 个器官,全部基于英国生物样本库 MRI 数据集。我们利用自动标记,引入了带有器官特定过滤器的自动标签清理管道,并手动注释了 300 个 MRI 子集,其中包含 11 个腹部类别,以验证质量(称为 UKBOB-manual)。这种方法允许扩大数据集收集规模,同时保持对标签的信心。我们通过证明经过过滤的 UKBOB 训练的模型在其他来自相似领域(例如,腹部 MRI)的小型标记数据集上的零样本泛化来进一步确认标签的有效性。为了进一步减轻噪声标签的影响,我们提出了一种名为熵测试时自适应 (ETTA) 的新方法来改进分割输出。我们使用 UKBOB 训练了一个用于 3D 医学图像分割的基础模型 Swin-BOB,该模型基于 Swin-UNetr 架构,在多个 3D 医学影像基准测试中取得了最先进的结果,包括 BRATS 脑 MRI 肿瘤挑战赛(提高了 0.4%)和 BTCV 腹部 CT 扫描基准测试(提高了 1.3%)。预训练模型和代码可在 https://emmanuelleb985.github.io/ukbob 获取,经过过滤的标签将随英国生物样本库一起提供。
查看 arXiv 页面查看 PDF

评论

Niels RoggeNiels Rogge
论文提交者

代码:https://github.com/EmmanuelleB985/UK_BOB