藏文情感词典构建的现状分析OACSTPCD
近年来,许多研究者证实,基于深度学习的多特征融合情感分析方法比纯深度学习方法更能挖掘文本的情感信息,其中情感词特征是最重要的特征之一。目前,藏文虽然有少量的情感词典,但基本上没有公开,想要使用藏文情感词典资源,只能自行构建。研究藏文情感词典的构建现状能对后续藏文情感词典的构建提供帮助。为了解藏文情感词典的词汇分类方法、常用词典构建方法以及已有藏文情感词典的词汇量与词汇构成等方面的研究现状,文中通过对比和统计等方法分析了近10年藏文情感词典构建相关的文献(以CHKI为主),总结出了藏文情感词典构建方面的研究状况。经研究发现,情感词的分类方法中,主要有7大类21小类、12大类20小类、2大类18小类等。藏文情感词典的构建方法包括词典匹配、机器翻译、SO-PMI扩充、基于word2vec或BERT的相似度扩充方法等。已有藏文情感词典的词汇量大致在5000至28000之间,接近中文情感词典的水平,词汇构成主要包含情感词、程度副词、否定词、双重否定词、表情词等。希望为相关研究人员提供参考。
才让东知;杨杰;尼玛扎西;
藏文信息技术教育部工程研究中心,西藏拉萨850000 西藏大学信息科学技术学院,西藏拉萨850000藏文信息技术教育部工程研究中心,西藏拉萨850000 西藏大学信息科学技术学院,西藏拉萨850000 西藏信息化省部共建协同创新中心,西藏拉萨850000
计算机与自动化
藏文情感词典情感词分类词典构建方法词汇量词汇构成
《计算机技术与发展》 2024 (003)
P.9-14 / 6
国家科技创新2030——“新一代人工智能”重大项目(2022ZD0116101);西藏大学2021级研究生‘高水平人才培养计划’项目(2021-GSP-S129)。
评论