利用技术分类号辅助的无监督专利实体抽取方法研究OA
[目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基…查看全部>>
陈亮;尚玮姣;余池;牟琳;夏春姊;葛川
中国科学技术信息研究所,北京100038中国林业科学研究院林业科技信息研究所,北京100091中国科学技术信息研究所,北京100038中国科学技术信息研究所,北京100038中国科学技术信息研究所,北京100038山西省科技情报与战略研究中心,太原030032
实体抽取主题模型专利挖掘技术分类号
《知识管理论坛》 2024 (4)
P.422-436,15
山西省科技合作交流专项项目“基于大数据的山西省科研项目相似性监测技术研发及应用示范”(项目编号:202204041101034)研究成果之一
评论