|国家科技期刊平台
首页|期刊导航|计算机应用研究|基于查询语义特性的稠密文本检索模型

基于查询语义特性的稠密文本检索模型OA北大核心CSTPCD

中文摘要

针对现有稠密文本检索模型(dense passage retrieval,DPR)存在的负采样效率低、易产生过拟合等问题,提出了一种基于查询语义特性的稠密文本检索模型(Q-DPR)。首先,针对模型的负采样过程,提出了一种基于近邻查询的负采样方法。该方法通过检索近邻查询,快速地构建高质量的负相关样本,以降低模型的训练成本。其次,针对模型易产生过拟合的问题,提出了一种基于对比学习的查询自监督方法。该方法通过建立查询间的自监督对比损失,缓解模型对训练标签的过拟合,从而提升模型的检索准确性。Q-DPR在面向开放领域问答的大型数据集MSMARCO上表现优异,取得了0.348的平均倒数排名以及0.975的召回率。实验结果证明,该模型成功地降低了训练的开销,同时也提升了检索的性能。

赵铁柱;林伦凯;杨秋鸿;

东莞理工学院计算机科学与技术学院,广东东莞523808东莞城市学院人工智能学院,广东东莞523419

计算机与自动化

查询稠密文本检索近邻对比学习自监督

《计算机应用研究》 2024 (005)

P.1388-1393 / 6

广东省普通高校重点领域专项资助项目(2021ZDZX3007);东莞市社会发展科技资助项目(20231800936732);东莞城市学院青年教师发展基金资助项目(2022QJY005Z)。

10.19734/j.issn.1001-3695.2023.09.0412

评论