⏶13
MedGemma 1.5 技术报告
发表
由
taesiri 提交
作者: Andrew Sellergren, Chufan Gao, Fereshteh Mahvar, Timo Kohlberger, Fayaz Jamil, Madeleine Traverse, Alberto Tono, Bashir Sadjad, Lin Yang, Charles Lau, Liron Yatziv, Tiffany Chen, Bram Sterling, Kenneth Philbrick, Richa Tiwari, Yun Liu, Madhuram Jajoo, Chandrashekar Sankarapu, Swapnil Vispute, Harshad Purandare, Abhishek Bijay Mishra, Sam Schmidgall, Tao Tu, Anil Palepu, Chunjong Park, Tim Strother, Rahul Thapa, Yong Cheng, Preeti Singh, Kat Black, Yossi Matias, Katherine Chou, Avinatan Hassidim, Kavi Goel, Joelle Barral, Tris Warkentin, Shravya Shetty, Dale Webster, Sunny Virmani, David F. Steiner, Can Kirmizibayrak, Daniel Golden
摘要
AI 生成总结
MedGemma 1.5 4B 通过扩展多模态支持以及提高在医学影像、文档理解和临床推理任务中的表现,增强了医疗人工智能的能力。我们推出了 MedGemma 1.5 4B,它是 MedGemma 系列中的最新模型。MedGemma 1.5 在 MedGemma 1 的基础上扩展了更多能力:高维医学影像(CT/MRI 体数据和病理全切片图像)、通过边界框进行的解剖定位、多时间点胸部 X 射线分析以及增强的医疗文档理解(化验报告、电子病历)。我们详细介绍了在单一架构中实现这些模态所需的创新,包括新的训练数据、长上下文 3D 体切片以及全切片病理采样。与 MedGemma 1 4B 相比,MedGemma 1.5 4B 在这些新领域表现出显著提升:3D MRI 病症分类准确率提高 11%,3D CT 病症分类准确率提高 3%(绝对值提升)。在全切片病理成像中,MedGemma 1.5 4B 实现了 47% 的宏观 F1 增益。此外,它还改进了解剖定位,胸部 X 射线的交并比(IoU)提高了 35%,并在纵向(多时间点)胸部 X 射线分析中达到了 4% 的宏观准确率。除了在多模态性能上优于 MedGemma 1,MedGemma 1.5 在基于文本的临床知识和推理方面也有所进步,MedQA 准确率提高了 5%,EHRQA 准确率提高了 22%。它还在 4 个不同的化验报告信息提取数据集上实现了 18% 的平均宏观 F1。综合而言,MedGemma 1.5 为社区提供了一个强大的开放资源,作为一个更优的基础模型,开发者可以在此基础上创建下一代医疗 AI 系统。关于 MedGemma 1.5 的资源和教程可在 https://goo.gle/MedGemma 找到。