语义相似度与BERT模型融合的多标签文本自适应分类方法OACSTPCD
针对文本搜索需求难以判断、文本难以分类的问题,研究语义相似度与双向语言编码器(BERT)模型融合的多标签文本自适应分类方法。先预处理文本并确定文本表示形式,基于信息增益理论提取并降维处理文本特征,依据语义相似度理论计算文本之间相似度,再引入BERT模型搭建多标签文本自适应分类框架,通过对抗训练获取模型最佳参数,将待分类文本输入至训练好文本分类BERT模型中,即可实现多标签文本的自适应分类。实验数据显示应用提出方法获得F 1参量大于给定最小限值,汉明损失参量HL小于给定最大限值,充分证实了提出方法文本分类效果较佳。
张红;
北京太极信息系统技术有限公司,北京100000
计算机与自动化
BERT模型多标签语义相似度文本分类
《微型电脑应用》 2024 (003)
P.49-52 / 4
四川省公安科研中心重点研发项目(2019YFS0067)。
评论