RedDino:用于红细胞分析的基础模型

发表
Luca ZeddaLuca Zedda 提交
作者: Luca ZeddaLuca Zedda, Andrea Loddo, Cecilia Di Ruberto, Carsten Marr

摘要

红细胞(RBCs)对人体健康至关重要,其精确的形态分析对于诊断血液学疾病非常重要。尽管基础模型在医学诊断中前景广阔,但用于红细胞分析的综合人工智能解决方案仍然稀缺。我们推出了 RedDino,一个专为红细胞图像分析设计的自监督基础模型。RedDino 采用了 DINOv2 自监督学习框架的红细胞特定改编版,并在包含来自不同采集模式和来源的 125 万张红细胞图像的精选数据集上进行训练。广泛的评估表明,RedDino 在红细胞形状分类方面优于现有的最先进模型。通过线性探测和最近邻分类等评估,我们证实了其强大的特征表示和泛化能力。我们的主要贡献是:(1) 一个专为红细胞分析量身定制的基础模型,(2) 探索 DINOv2 配置用于红细胞建模的消融研究,以及 (3) 对泛化性能的详细评估。RedDino 通过捕捉细微的形态特征,解决了计算血液学中的关键挑战,推动了可靠诊断工具的开发。RedDino 的源代码和预训练模型可在 https://github.com/Snarci/RedDino 获得,预训练模型可从我们的 Hugging Face 合集 https://huggingface.co/collections/Snarcy/reddino-689a13e29241d2e5690202fc 下载。
查看 arXiv 页面查看 PDF

评论

Luca ZeddaLuca Zedda
论文作者
论文提交者

我们推出了 RedDino,这是我们专门为红细胞(RBC)分析设计的自监督基础模型。RedDino 基于定制的 DINOv2 骨干网络,在迄今为止最大的 RBC 数据集上进行了训练——超过 125 万张 RBC 图像和来自 18 个数据集的 300 多万个分割细胞,涵盖多种成像模式和染色方案。

在多个数据集(Elsafty、Chula、DSE)上,RedDino 在加权 F1、平衡准确率和准确率方面均优于 ResNet50、DinoBloom 和普通 DINOv2 2-3%,同时对分布外数据表现出强大的泛化能力。

通过 RedDino,我们为自动化 RBC 形态分析设定了新的基准,并为未来的血液学 AI 应用提供了强大、可泛化的骨干网络。