结合LDA与Word2vec的文本语义增强方法OA北大核心CSTPCD
Text Semantic Enhancement Method Combining LDA and Word2vec
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型.该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出…查看全部>>
唐焕玲;卫红敏;王育林;朱辉;窦全胜
山东工商学院 计算机科学与技术学院,山东 烟台 264005山东省高等学校协同创新中心:未来智能计算,山东 烟台 264005山东省高校智能信息处理重点实验室(山东工商学院),山东 烟台 264005山东工商学院 信息与电子工程学院,山东 烟台 264005山东工商学院 计算机科学与技术学院,山东 烟台 264005
信息技术与安全科学
LDA主题模型Word2vec模型语义词向量语义相似度文本分类
《计算机工程与应用》 2022 (13)
海洋浮游生物类别非均衡图像集细粒度识别研究
135-145,11
国家自然科学基金(61976124,61976125,62176140,61873177,61972235,82001775).
评论