基于信息融合和数据增强的篇章级事件检测方法OA北大核心CSTPCD
事件检测是自然语言处理领域的关键任务,旨在识别事件触发词并正确分类其事件类型。语句级事件检测方法未能有效利用文本中的句内和句间事件相关性信息,面临着一词多义、事件共现等众多难题。此外,基于神经网络的事件检测模型需要大量的文本数据作为训练支撑,但语料库的数据不足严重影响着结果的准确率及模型的稳定性。针对上述问题,提出了基于信息融合和数据增强的篇章级事件检测方法LGIA。该方法采用编-解码框架,设计了基于膨胀卷积网络的句子级局部信息抽取模块和基于条件层归一化的篇章级全局信息抽取模块,以深入挖掘整个文档的上下文语义信息和事件间的相关性。同时,采用了同义词替换的数据增强策略,有效扩充了数据样本,从而缓解了数据不足问题带来的影响。经实验验证,LGIA方法在ACE2005数据集上取得了较好的结果,并在数据增强后的TAC-KBP2017数据集上得到了显著的性能提升,F1值分别达到了77.6%和65.3%,相较于现有的基线方法展现出了更优越的性能表现。
谭立君;胡艳丽;曹健威;谭真;
国防科技大学信息系统工程全国重点实验室,长沙410073
计算机与自动化
事件检测信息融合数据增强编码-解码框架
《计算机科学与探索》 2024 (011)
P.3015-3026 / 12
国家重点研发计划(2022YFB3103600);国家自然科学基金(72371245)。
评论