基于双分支特征融合的电力设备缺陷文本挖掘方法OA北大核心CSTPCD
针对电力设备缺陷文本信息的知识挖掘与分析任务中存在缺陷文本特征信息提取不足、缺陷文本分类精度不够的问题,提出一种基于BERT(bidirectional encoder representations from transformers)的双分支特征融合的电力设备缺陷文本分类模型。首先,对缺陷文本数据进行预处理,删除异常缺陷文本,并归纳了电力设备缺陷文本特点;然后,采用BERT模型作为文本编码器,将文本转化为向量后分别输入至BiLSTMAttention(attention-based bidirectional long short-term memory)模块和多分支CNN(multi-scale convolutional neural network,MCNN)模块,提取缺陷文本语义信息特征和局部关键信息特征;最后,将所提取出的语义特征和多维关键特征向量进行融合,并通过Softmax层实现对缺陷文本分类。与基准模型BERT-BiLSTMAttention相比,其准确率、召回率及F1值分别提高了2.76%、3.58%和4.39%,表明所建模型在缺陷文本分类任务中性能的优越性。
张中文;吐松江·卡日;张紫薇;崔传世;邵罗;
新疆大学电气工程学院,乌鲁木齐830049清华四川能源互联网研究院,成都610299
动力与电气工程
预训练模型多维特征提取语义信息特征缺陷文本分类
《高压电器》 2024 (006)
P.188-196 / 9
新疆维吾尔自治区自然科学基金面上项目资助(2022D01C35);国家自然科学基金项目资助(52067021,52207165)。
评论