半监督图节点分类任务的清洁标签后门植入OA
半监督图学习旨在使用给定图中的各种先验知识推断未标记节点或图的类别,通过提升数据标注的自动化,使其具有较高的节点分类效率。作为一种深度学习架构,半监督图学习也面临后门攻击威胁,但目前尚未出现对半监督图节点分类任务有效的后门攻击方法。文中提出了一种针对半监督图节点分类模型的持久性清洁标签后门攻击方法,通过在未标记的训练数据上自适应地添加触发器和对抗扰动生成中毒样本,并在不修改标签的情况下训练得到中毒的半监督图节点分类模型。而攻击者可以较为隐蔽地对模型进行投毒,且投毒率不高于4%。同时为了保证后门在模型中的持久性,设计了一种超参数调节策略以选择最佳的对抗扰动尺寸。在多个半监督图节点分类模型与开源数据集上进行的大量实验,结果表明所提方法的攻击成功率最高可达96.25%,而模型在正常样本上的分类精度几乎没有损失。
杨潇;李高磊;
上海交通大学电子信息与电气工程学院,上海200240
计算机与自动化
半监督图学习图神经网络节点分类对抗样本数据投毒后门攻击持久性攻击,清洁标签后门
《电子科技》 2024 (009)
P.57-63 / 7
国家自然科学基金(U20B2048);国防基础科研项目(JCKY2020604B004)。
评论