基于MacBERT-BiLSTM-CRF模型的继电保护装置缺陷知识图谱构建方法OA北大核心CSTPCD
电网发展至今积累了大量继电保护装置缺陷文本数据,尚未被有效挖掘利用。此外,继电保护装置的缺陷排除工作过度依赖运行人员的专业能力,现场运维工作难度大。针对上述问题,提出基于MacBERT-BiLSTM-CRF模型的继电保护装置缺陷知识图谱构建方法。首先,分析继电保护装置缺陷文本的记录特点,对非结构化文本进行数据清洗、数据标注以及数据增强处理。其次,基于BERT-BiLSTM-CRF模型构建MacBERT-BiLSTM-CRF模型进行实体抽取任务。然后,定义继电保护装置缺陷文本的关系抽取规则,结合实体抽取模型共同完成关系抽取任务。最后,构建继电保护装置缺陷知识图谱的模式层,并利用Neo4j图数据库实现知识图谱数据层的存储。算例分析表明,所提数据处理方法能够得到高质量BIO标注数据集。相比于传统BERT-BiLSTM-CRF模型,MacBERT-BiLSTM-CRF模型的实体抽取效果更好。基于模式层完成了继电保护装置缺陷知识图谱的构建与可视化展示,并提出继电保护装置缺陷辅助决策的应用流程与知识图谱的更新方法。
戴志辉;张富泽;张近月;韩笑;
河北省分布式储能与微网重点实验室(华北电力大学),河北保定071003华北电力大学控制与计算机工程学院,河北保定071003
动力与电气工程
继电保护装置缺陷文本实体抽取关系抽取知识图谱
《电力系统保护与控制》 2024 (020)
P.131-143 / 13
国家自然科学基金项目资助(51877084)。
评论