基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别OA北大核心CHSSCDCSSCICSTPCD
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。
胡泽文;韩雅蓉;王梦雅;
南京信息工程大学知识产权研究院,江苏南京210044
计算机与自动化
机器学习LDA模型Word2vec主题演化热点主题主题影响力主题关注度
《现代情报》 2024 (004)
P.154-167 / 14
国家社会科学基金项目“面向海量科技文献的潜在‘精品’识别方法与应用研究”(项目编号:20CTQ031);江苏省教育厅江苏高校“青蓝工程”项目资助。
评论