学术论文学科领域层次标签分类方法OA
针对学术论文在学科领域内进行层次标签分类问题,提出了一种基于知识增强的语义表示与图注意力网络的文本层次标签分类(text hierarchical label classification based on enhanced representation through knowledge integration and graph attention networks, GETHLC)模型。首先,通过层次标签抽取模块提取学科领域下层次标签的结构特征,并通过预训练模型对学术论文的摘要、标题和抽取后的层次标签结构特征进行嵌入;然后,在分类阶段基于层次标签的结构分层构造层次分类器,将学术论文逐层分类至最符合的类别中。在大规模中文科学文献数据集CSL上进行的实验结果表明,与基准的ERNIE模型相比,GETHLC模型的准确率、召回率和F1值分别提升了5.78、4.31和5.02百分点。
贾启龙;张仰森;刘帅康;朱思文;高强;
北京信息科技大学智能信息处理实验室,北京100192
计算机与自动化
层次标签文本分类图注意力机制知识增强的语义表示预训练
《北京信息科技大学学报(自然科学版)》 2024 (001)
P.42-48,54 / 8
国家自然科学基金项目(62176023)。
评论