结合对抗训练和特征混合的孪生网络防御模型OA北大核心CSTPCD
神经网络模型容易受到对抗样本攻击。针对当前防御方法侧重改进模型结构或模型仅使用对抗训练方法导致防御类型单一且损害模型分类能力、效率低下的问题,提出结合对抗训练和特征混合训练孪生神经网络模型(SS-ResNet18)的方法。该方法通过线性插值混合训练集样本数据,使用残差注意力模块搭建孪生网络模型,将PGD对抗样本和正常样本输入不同分支网络进行训练。在特征空间互换相邻样本部分输入特征以增强网络抗干扰能力,结合对抗损失和分类损失作为网络整体损失函数并对其进行标签平滑。在CIFAR-10和SVHN数据集上进行实验,该方法在白盒攻击下表现出优异的防御性能,黑盒攻击下模型对PGD、JSMA等对抗样本的防御成功率均在80%以上;同时,SS-ResNet18模型时间花销仅为子空间对抗训练方法的二分之一。实验结果表明,SS-ResNet18模型能防御多种对抗样本攻击,与现有防御方法相比,其鲁棒性强且训练耗时较短。
张新君;程雨晴;
辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105
计算机与自动化
孪生神经网络图像分类对抗样本对抗训练注意力机制特征混合
《计算机应用研究》 2024 (003)
P.905-910 / 6
2022年辽宁省教育厅基本科研项目(LJKMZ20220678);辽宁省教育厅科学研究经费项目(LJ2020JCL007);辽宁工程技术大学博士启动基金资助项目(20-1020)。
评论