⏶2
VisText-Mosquito:一个用于人工智能蚊子繁殖地检测和推理的多模态数据集和基准
发表
由
Md. Faiyaz Abdullah Sayeedi 提交

作者:
Md. Adnanul Islam,
Md. Faiyaz Abdullah Sayeedi, Md. Asaduzzaman Shuvo, Muhammad Ziaur Rahman, Shahanur Rahman Bappy, Raiyan Rahman, Swakkhar Shatabda


摘要
蚊媒疾病构成全球主要的健康风险,需要早期发现并主动控制滋生地以预防疫情爆发。在本文中,我们介绍了VisText-Mosquito,这是一个多模态数据集,它整合了视觉和文本数据,以支持蚊子滋生地分析中的自动化检测、分割和推理。该数据集包含1,828张用于目标检测的标注图像,142张用于水面分割的图像,以及与每张图像链接的自然语言推理文本。YOLOv9s模型在目标检测方面取得了最高的精确度0.92926和mAP@50达到0.92891,而YOLOv11n-Seg的分割精确度达到0.91587,mAP@50达到0.79795。在推理生成方面,我们微调的BLIP模型最终损失为0.0028,BLEU分数为54.7,BERTScore为0.91,ROUGE-L为0.87。该数据集和模型框架强调“预防胜于治疗”的主题,展示了AI检测如何主动解决蚊媒疾病风险。数据集和实现代码已在GitHub公开:https://github.com/adnanul-islam-jisun/VisText-Mosquito
从 Mendeley Data 下载数据集:https://data.mendeley.com/datasets/rtsfh7jh7p/2