基于双层数据增强的监督对比学习文本分类模型OA北大核心CSTPCD
针对DoubleMix算法在数据增强时的非选择性扩充及训练方式的不足,提出一种基于双层数据增强的监督对比学习文本分类模型,有效提高了在训练数据稀缺时文本分类的准确率.首先,对原始数据在输入层进行基于关键词的数据增强,不考虑句子结构的同时对数据进行有选择增强;其次,在BERT隐藏层对原始数据与增强后的数据进行插值,然后送入TextCNN进一步提取特征;最后,使用Wasserstein距离和双重对比损失对模型进行训练,进而提高文本分类的准确率.对比实…查看全部>>
吴量;张方方;程超;宋诗楠
长春工业大学计算机科学与工程学院,长春130012长春工业大学计算机科学与工程学院,长春130012长春工业大学计算机科学与工程学院,长春130012长春工业大学计算机科学与工程学院,长春130012
计算机与自动化
数据增强文本分类对比学习监督学习
《吉林大学学报(理学版)》 2024 (5)
P.1179-1187,9
吉林省发展和改革委员会项目(批准号:2022C047-7)长春市科技发展计划项目(批准号:21GD05)。
评论