|国家科技期刊平台
首页|期刊导航|自动化学报|收缩、分离和聚合:面向长尾视觉识别的特征平衡方法

收缩、分离和聚合:面向长尾视觉识别的特征平衡方法OA北大核心CSTPCD

中文摘要

数据在现实世界中通常呈现长尾分布,即,少数类别拥有大量样本,而多数类别仅有少量样本.这种数据不均衡的情况会导致在该数据集上训练的模型对于样本数量较少的尾部类别产生过拟合.面对长尾视觉识别这一任务,提出一种面向长尾视觉识别的特征平衡方法,通过对样本在特征空间中的收缩、分离和聚合操作,增强模型对于难样本的识别能力.该方法主要由特征平衡因子和难样本特征约束两个模块组成.特征平衡因子利用类样本数量来调整模型的输出概率分布,使得不同类别之间的特征距离更加均衡,从而提高模型的分类准确率.难样本特征约束通过对样本特征进行聚类分析,增加不同类别之间的边界距离,使得模型能够找到更合理的决策边界.该方法在多个常用的长尾基准数据集上进行实验验证,结果表明不但提高了模型在长尾数据上的整体分类精度,而且显著提升了尾部类别的识别性能.与基准方法BS相比较,该方法在CIFAR100-LT、ImageNet-LT和iNaturalist 2018数据集上的性能分别提升了7.40%、6.60%和2.89%.

杨佳鑫;于淼淼;李虹颖;李硕豪;范灵毓;张军;

国防科技大学系统工程学院,长沙410073 大数据与决策实验室,长沙410073中国人民解放军96962部队,北京102206

计算机与自动化

长尾识别损失设计特征平衡特征约束

《自动化学报》 2024 (005)

P.898-910 / 13

国家自然科学基金(62101571);湖南省自然科学基金(2021JJ40685)资助。

10.16383/j.aas.c230288

评论