首页|期刊导航|现代信息科技|基于实体知识的石油炼化领域命名实体识别

基于实体知识的石油炼化领域命名实体识别OA

Named Entity Recognition in Petroleum Refining Domain Based on Entity Knowledge

中文摘要英文摘要

石油炼化领域中的命名实体识别任务存在着标注数据稀缺,以及现有的预训练语言模型不能很好识别领域组合和嵌套实体的问题.基于此,首先提出一种基于外部实体知识的数据增强方法(EEKR),通过引入外部实体知识库,将其与标注数据中的实体进行实体级别替换完成数据增强,有效解决标注数据稀缺的问题.之后提出了基于内部实体知识的命名实体识别模型(IIEKNER),通过获取标注样本中的内部实体嵌入,将内部实体知识融入预训练模型,从而可以更准确地识别出石油炼化领域中的嵌…查看全部>>

Named entity recognition task in the petroleum refining domain suffers from the problems of scarcity of labeled data as well as the existing pre-trained language models cannot recognize domain combination and nested entities well.Based on this,a data augmentation method EEKR(External Entity Knowledge Replacement,EEKR)based on external entity knowledge is firstly proposed,which effectively solves the problem of scarcity of labeled data by introducing an exter…查看全部>>

丁建新;王晓伟;温欣;屈克将;王建华;赵艳红;胡思颍

昆仑数智科技有限责任公司 智慧油服事业部,北京 100071中国石油大学(北京) 信息科学与工程学院/人工智能学院,北京 102249昆仑数智科技有限责任公司 智慧油服事业部,北京 100071昆仑数智科技有限责任公司 智慧油服事业部,北京 100071昆仑数智科技有限责任公司 智慧油服事业部,北京 100071昆仑数智科技有限责任公司 智慧油服事业部,北京 100071中国石油大学(北京) 信息科学与工程学院/人工智能学院,北京 102249

计算机与自动化

命名实体识别石油炼化领域数据增强BERT

named entity recognitionpetroleum refining domaindata augmentationBERT

《现代信息科技》 2024 (12)

40-46,7

国家重点研发计划(2019YFC0312003)

10.19850/j.cnki.2096-4706.2024.12.010

评论

您当前未登录!去登录点击加载更多...