首页|期刊导航|计算机工程|结合五笔字形与上下文相关字向量的命名实体识别

结合五笔字形与上下文相关字向量的命名实体识别OA北大核心CSCDCSTPCD

Named Entity Recognition Combining Wubi Glyphs with Contextualized Character Embeddings

中文摘要

命名实体识别(NER)作为自然语言处理的重要部分,在信息抽取和知识图谱等任务中得到广泛应用.然而目前中文预训练语言模型通常仅对上下文中的字符进行建模,忽略了中文字符的字形结构.提出2种结合五笔字形的上下文相关字向量表示方法,以增强字向量的语义表达能力.第一种方法分别对字符和字形抽取特征并联合建模得到字向量表示,第二种方法将五笔字形作为辅助信息拼接到字向量中,训练一个基于字符和五笔字形的混合语言模型.实验结果表明,所提两种方法可以有效提升中文NER…查看全部>>

张栋;王铭涛;陈文亮

苏州大学 计算机科学与技术学院,江苏 苏州 215006苏州大学 计算机科学与技术学院,江苏 苏州 215006苏州大学 计算机科学与技术学院,江苏 苏州 215006

信息技术与安全科学

语言模型命名实体识别五笔字形上下文相关字向量无标注语料

《计算机工程》 2021 (3)

基于噪音数据的中文知识图谱增量式构建研究

94-101,8

国家自然科学基金(61876115).

10.19678/j.issn.1000-3428.0057265