基于ChineseBERT和多特征协同网络的电力设备缺陷文本分类模型OACSTPCD
针对传统模型特征提取不够全面,词向量语义表达不准确等问题,提出了结合ChineseBERT和多特征协同网络的电力设备缺陷文本分类模型。采用针对汉字优化的ChineseBERT模型提取文本向量表征,提高词向量语义表示的准确性。多特征协同网络全面捕捉缺陷文本局部和上下文语义特征。软注意力机制提升模型聚焦于关键特征的能力。在真实电力设备缺陷文本数据集开展实验,结果表明该模型分类性能优于近期表现较好的深度学习模型,F1分数高达96.82%,证明了模型的有效性。
李瑛;耿军伟;赵留学;陈波;
国网北京市电力公司,北京100031 北京电力经济技术研究院有限公司,北京100055国网北京市电力公司,北京100031
计算机与自动化
文本分类ChineseBERT多特征协同软注意力
《微型电脑应用》 2024 (002)
P.106-109 / 4
国网北京市电力公司科技项目(520234220001)。
评论