超越线性瓶颈:基于样条的知识蒸馏用于多元文化艺术风格分类

发表
Salah Eddine BekhoucheSalah Eddine Bekhouche 提交
作者: Abdellah Zakaria Sellam, Salah Eddine BekhoucheSalah Eddine Bekhouche, Cosimo Distante, Abdelmalik Taleb-Ahmed

摘要

由于专业标注数据集的稀缺以及风格元素之间复杂且通常非线性的相互作用,艺术风格分类在计算美学领域仍然是一个艰巨的挑战。虽然最近的双教师自监督框架减少了对标注数据的依赖,但其线性投影层和局部化的关注点难以建模全局构图背景和复杂的风格特征交互。我们通过将传统的 MLP 投影头和预测头替换为柯尔莫哥洛夫-阿诺德网络 (KANs) 来增强双教师知识蒸馏框架,以解决这些局限性。我们的方法保留了来自两个教师网络的互补性指导,其中一个教师网络强调局部纹理和笔触模式,另一个则捕捉更广泛的风格层次,同时利用 KANs 基于样条的激活函数以数学精度建模非线性的特征相关性。在 WikiArt 和 Pandora18k 数据集上的实验表明,我们的方法在 Top-1 准确率上优于基础的双教师架构。我们的研究结果凸显了 KANs 在解开复杂风格流形方面的重要性,从而获得了比 MLP 投影更好的线性探针准确率。
查看 arXiv 页面查看 PDF
超越线性瓶颈:基于样条的知识蒸馏用于多元文化艺术风格分类

评论

Salah Eddine BekhoucheSalah Eddine Bekhouche
论文作者
论文提交者

通过用科尔莫哥洛夫-阿诺德网络 (KANs) 替换传统的 MLP 投影和预测头,增强双教师知识蒸馏框架以解决一些局限性