基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析OA北大核心CSTPCD
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。
王孟;苏进城;陈志德;
福建师范大学研究生院,福建福州350117福建师范大学计算机与网络空间安全学院,福建福州350117
计算机与自动化
硕士学位论文自然语言处理LDA模型Word2Vec模型TextRank方法
《福建师范大学学报(自然科学版)》 2024 (005)
P.41-51 / 11
国家自然科学基金资助项目(61841701、62277010)。
评论