短文本语义相似度计算研究OACSTPCD
Research on Short Text Semantic Similarity Computation
文本相似度在同义词测试、信息抽取、文本分类、机器翻译等自然语言处理领域有着广泛的应用.在网络信息爆炸的今天,大量可用的信息如科学文献的摘要、说明、产品描述等以短文本形式呈现.当前关注大文件或独立词的相似度计算方法在短文本上的效果欠佳.对此提出一种短文本相似度计算方法,基于向量的余弦相似基线,使用一种将词与词之间的相似性和词的特异性指标结合到一起的方法来达到最佳的性能,在数据集上进行的实验表明,语义相似度方法优于基于简单词汇匹配的方法,其整体精确度提高,误差率显著降低.
张敏
西安翻译学院工程技术学院,西安710105
信息技术与安全科学
短文本语义相似度idf
《微型电脑应用》 2019 (10)
39-40,43,3
陕西省教育厅科学研究项目(15JK2043)校级重点科研项目(16A02)校级科研团队资助项目(XFU17KYTDB02)
评论