⏶2
卫星图像分类的多任务注意力平衡:一种无需预训练即可实现 EuroSAT 97.23% 准确率的系统方法
发表
由
onurcan 提交
作者: Aditya Vir
摘要
AI 生成总结
自定义卷积神经网络中的一种新颖的平衡多任务注意力机制,在没有预训练模型的情况下,将 EuroSAT 数据集上的卫星土地利用分类精度提高到 97.23%。这项工作对用于卫星土地利用分类的自定义卷积神经网络架构进行了系统研究,在 EuroSAT 数据集上实现了 97.23% 的测试准确率,且无需依赖预训练模型。
通过三个渐进的架构迭代(基线:94.30%、
CBAM 增强:95.98%、以及均衡多任务注意力:97.23%),我们识别并解决了卫星图像分类中的特定失效模式。
我们的主要贡献是一种新颖的均衡多任务注意力机制,它将坐标注意力用于空间特征提取与
Squeeze-Excitation 模块用于光谱特征提取相结合,并通过一个可学习的融合参数进行统一。
实验结果表明,这个
可学习的参数自主收敛到大约 0.57 的 alpha 值,表明空间和光谱模态对于卫星图像的重要性几乎相等。
我们采用了渐进式的 DropBlock 正则化(按网络深度为 5-20%)和类别均衡的损失加权来解决过拟合和混淆模式不平衡的问题。
最终的 12 层架构达到了 0.9692 的 Cohen Kappa 系数,所有类别的准确率均超过 94.46%,展示了置信度校准,正确和错误预测之间的差距为 24.25%。
我们的方法在性能上仅比微调的 ResNet-50 (98.57%) 低 1.34%,同时不需要外部数据,验证了系统架构设计在领域特定应用中的有效性。
完整的代码、训练模型和评估脚本均已公开提供。
🌍 欧罗卫星图像分类