面向文本实体关系抽取研究综述OA北大核心CSTPCD
信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系抽取按照抽取文本长度可以分为句子级关系抽取和文档级关系抽取,两种级别的抽取方法在不同应用场景下各有优缺点。句子级关系抽取适用于较小规模数据集的应用场景,而文档级关系抽取适用于新闻事件分析、长篇报告或文章的关系挖掘等场景。不同于已有的关系抽取,介绍了关系抽取的基本概念以及领域内近年来的发展历程,罗列了两种级别关系抽取所采用的数据集,对数据集的特点进行概述;分别对句子级关系抽取和文档级关系抽取进行了阐述,介绍了不同级别关系抽取的优缺点,并分析了各类方法中代表模型的性能以及局限性;总结了当前研究领域中存在的问题并对关系抽取发展前景进行了展望。
任安琪;柳林;王海龙;刘静;
内蒙古师范大学计算机科学技术学院,呼和浩特010022 内蒙古师范大学计算机科学联合创新实验室,呼和浩特010022内蒙古大学图书馆,呼和浩特010021
计算机与自动化
信息抽取实体关系抽取句子级关系抽取文档级关系抽取知识图谱构建
《计算机科学与探索》 2024 (011)
P.2848-2871 / 24
国家重点研发计划(2020YFC1523305);内蒙古自治区自然科学基金(2023LHMS06006);内蒙古师范大学基本科研业务费专项资金(2022JBYJ032);内蒙古自治区档案馆档案科技项目(2023-13);无穷维哈密顿系统及其算法应用教育部重点实验室(内蒙古师范大学)开放课题(2023KFYB03,2023KFZD03)。
评论