融合多特征和表情情感词典的性别对立言论识别方法OA北大核心CSTPCD
为识别相关极端言论,提出了一种融合多特征和表情情感词典的性别对立言论识别方法。首先,使用BERT(Bidirectional encoder representation from transformer)提取输入文本的字符特征,并使用Word2Vec提取输入文本中五笔、郑码以及拼音3个方面的特征;然后,将这4个方面的特征进行融合,再输入到Bi-GRU(Bi-directional gated recurrent unit)网络中学习更深层次的语义信息;最后,通过全连接层加SoftMax函数计算出情感极性概率,并融合表情情感词典判别输入文本是否为性别对立言论。通过在自行收集的中文性别对立数据集上进行实验,与未加入特征和表情情感词典的方法相比,在F1值上有5.19%的提升。同时,在公开中文情感分析数据集Weibo_senti_100k上进行验证,证明了本方法的泛化性。
马子晨;张顺香;刘云朵;朱广丽;
安徽理工大学计算机科学与工程学院,淮南232001 合肥综合性国家科学中心人工智能研究院,合肥232088
计算机与自动化
性别对立表情情感词典多特征BERTBi-GRUWord2Vec
《数据采集与处理》 2024 (003)
P.699-709 / 11
国家自然科学基金面上项目(62076006);安徽省高校协同创新项目(GXXT⁃2021⁃008)。
评论