基于交互式特征与多尺度特征的文本相似度研究OACSTPCD
针对文本相似度分析过程中缺乏信息传递和忽略多元语义信息而导致相似度计算结果准确率低的问题,结合双向长短期记忆网络(BiLSTM),提出一种新颖的交互式特征与多尺度特征的文本相似度模型(IF-MSF)。首先,利用BiLSTM对句子进行编码提取全局特征矩阵,分别用软注意力机制和余弦相似度对特征矩阵进行交互,以相互传递两组特征矩阵内部的语义信息。其次,加权两组交互式特征以综合所有交互信息,并利用BiLSTM对加权交互式特征和初始编码特征再编码以捕获特征之间的差异信息。再次,使用多尺度卷积提取差异信息的多元语义特征并结合通道注意力机制增强重要特征信息。最后,融合两组增强特征判断文本对是否相似。实验选取2个数据集来验证该方法,该模型F1值分别取得最高值88.15%和85.03%,优于其他方法。
尹春勇;沈子宁;
南京信息工程大学计算机学院、网络空间安全学院,江苏南京210044
计算机与自动化
文本相似度双向长短期记忆交互式特征多尺度特征通道注意力
《计算机技术与发展》 2024 (008)
P.86-92 / 7
国家自然科学基金面上项目(6177282)。
评论