|国家科技期刊平台
首页|期刊导航|情报杂志|结合文本聚类和多标签分类的学科交叉主题早期识别方法

结合文本聚类和多标签分类的学科交叉主题早期识别方法OA北大核心CHSSCDCSSCICSTPCD

中文摘要

[研究目的]以专利为研究数据,提出一种结合文本聚类和多标签分类的学科交叉主题早期识别方法。[研究方法]以“量子计算”作为研究领域,通过基于聚类结果的筛选和基于多标签分类的筛选等两种方法将大量非学科交叉专利从专利集合中过滤,进而在学科交叉专利占比较高的小数据集上采用主题识别方法实现学科交叉主题的早期识别。随后,在德温特专利数据集上进行实证研究,验证了所提出方法的有效性。[研究结论]研究发现了“量子加密技术”和“量子计算技术与量子计算机”等学科交叉主题。与已有方法相比,提出的识别方法可以在交叉领域尚处于萌芽期或成长期、相关文献数量较少的情况下,发现文献集合中的学科交叉主题。

冯岭;

华北水利水电大学信息工程学院,郑州450046 中国科学技术信息研究所科学计量与评价研究中心,北京100038

专利数据学科交叉主题早期识别多标签分类学科交叉专利文本聚类量子计算

《情报杂志》 2024 (008)

P.160-169 / 10

河南省软科学研究计划项目“结合技术属性差异与多指标的颠覆性技术发现方法研究”(编号:222400410445);科技大数据湖北重点实验室开放基金项目“结合技术属性差异与多指标的颠覆性技术发现方法研究”研究成果。

10.3969/j.issn.1002-1965.2024.08.019

评论