融合前缀调优和提示学习的仇恨言论检测方法OA北大核心
随着网络社交平台的发展,网络暴力的危害性日益凸显,其中仇恨言论作为网络暴力的一种表现形式,对其检测方法的研究有助于构建一个健康的互联网环境。然而,一方面先前的仇恨言论检测方法主要依赖于人工监管和关键词过滤,这些方法存在人工成本高且分类效果不佳的问题;另一方面,在互联网平台的监管下,仇恨言论的表达也变得更加含蓄、隐蔽,这对检测模型的文本理解能力提出了更高的要求。以ChatGPT为代表的大模型为仇恨言论检测任务提供了新的可能性,受其在各项下游任务中出色表现的启发,提出了一种融合前缀调优和提示学习的仇恨言论检测方法P-Prompt。利用前缀调优方法将大模型在相关数据集上进行微调,同时结合提示学习方法使模型能够识别并关注待检测文本中的仇恨言论词汇,从而进一步提升模型对仇恨言论的识别能力。实验结果验证了大模型在仇恨言论检测任务的有效性,与传统方法相比P-Prompt方法在仇恨言论检测的二分类和多分类任务中各项评价指标都取得了较明显的提升。
徐磊;胡亚豪;陈满;陈军;潘志松
中国人民解放军陆军工程大学指挥控制工程学院,南京210000中国人民解放军陆军工程大学指挥控制工程学院,南京210000中国人民解放军陆军工程大学指挥控制工程学院,南京210000中国人民解放军陆军工程大学指挥控制工程学院,南京210000中国人民解放军陆军工程大学指挥控制工程学院,南京210000
计算机与自动化
仇恨言论检测大语言模型前缀调优提示学习
《计算机科学与探索》 2025 (1)
P.97-106,10
国家自然科学基金(62076251)。
评论