基于词向量的句子相似度计算及其应用研究OA北大核心CSTPCD
Sentence similarity calculation based on word vector and its application research
目前计算机辅助翻译在相似度计算方面存在很大的局限性,精度较低。针对特定领域,收集领域相关的训练语料,采用Google的word2vec进行英语和汉语的词向量模型构建,设计并实现汉语句子的相似度计算方法,提出基于词向量Jaccard相似度与基于词向量依存句法相结合的相似度计算方法,实验结果显示其效果比传统方法有较大提升。最后,将相关英汉句子相似度算法以接口的形式封装,作为商品化软件华建IAT系统的相似度计算模块投入实际应用。
Currently,the computer aided translation has great limitation on similarity calculation,and its accuracy is low. For the specific field,the training corpus about the field was collected,and the word vector model of English and Chinese was constructed by using word2vec developed by Google to design and implement the similarity calculation method of Chinese sen⁃tences. The similarity calculation method of combining word vector Jaccard similarity with word vect…查看全部>>
郭胜国;邢丹丹
郑州财经学院 计算机系,河南 郑州 450044郑州财经学院 计算机系,河南 郑州 450044
信息技术与安全科学
计算机辅助翻译相似度计算词向量IAT系统
computer aided translationsimilarity calculationword vectorIAT system
《现代电子技术》 2016 (13)
99-102,107,5
评论