基于图神经网络的代码抄袭检测方法OA北大核心CSTPCD
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。
陈昌奉;赵宏州;周恺卿;
吉首大学计算机科学与工程学院,湖南吉首416000吉首大学通信与电子工程学院,湖南吉首416000
计算机与自动化
代码抄袭检测深度语义和结构信息提取图神经网络图注意力网络特征强化
《计算机工程与科学》 2024 (010)
P.1815-1824 / 10
国家自然科学基金(62266019);湖南省教育厅科学研究项目(21C0363)。
评论