基于Word2Vec的编程领域词语拼写错误检测算法OA北大核心CSTPCD
Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响。对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇进行分析,结合改进的编辑距离算法对文本进行自动检测纠错。实验结果表明,该算法能够对诸如此类专业性较强的领域主题文本进行自动检测纠错,并且能够较好地还原标准文段用词。
刘峻松;唐明靖;薛岗;杨成荣
云南大学软件学院,云南昆明650000云南师范大学生命科学学院,云南昆明650000云南大学软件学院,云南昆明650000六盘水师范学院,贵州六盘水553004
信息技术与安全科学
词向量编辑距离拼写纠错Word2VecStack Overflow
《计算机应用与软件》 2022 (3)
P.277-284,8
评论