基于对比学习的高价值发明专利识别——以无线通信网络领域为例OA北大核心CHSSCDCSSCICSTPCD
[研究目的]在众多专利中准确高效识别高价值发明专利,不仅对中国知识产权战略实施具有推动作用,还有助于促进高价值发明专利的技术转化。[研究方法]针对领域专利文本利用不充分的问题,对使用Bert在无线通信网络领域专利文本上进行对比学习预训练,得到领域适应的Bert模型。然后,利用领域适应的Bert模型训练高价值发明专利识别模型,并在高价值发明专利识别模型的训练过程中使用过采样策略缓解正负样本不均衡的问题,改善模型的效果。[研究结论]在包含62 000份无线通信网络中国发明专利数据集上的实验结果显示,使用对比学习和过采样策略训练得到的模型在Accuracy指标值和Macro-F1指标值上分别达到了97%和0.93,相比于直接使用Bert分别提升了9.77%和0.19。
薛航;施国良;陈挺;
河海大学商学院,南京211100
高价值发明专利专利识别专利文本专利价值评估对比学习无线通信网络
《情报杂志》 2024 (009)
P.179-187 / 9
中央高校基本业务费项目“基于图数据库的水利知识图谱关键技术研究”(编号:B200207036)研究成果。
评论