基于多算法融合的标准文本关键词提取与歧义处理方法研究OA
首先,基于多算法融合的标准文本关键词提取与歧义处理方法基于TF-IDF和TextRank相结合,同时在考虑词语位置、词性、词长与词频的基础上完成标准文本的关键词提取;然后,利用Hanlp对相同文本进行处理,并完成对比歧义处理。通过试验结果分析,该方法对于标准文本的关键词提取与歧义处理的效率提升、处理质量有显著效果,也为大模型结合知识库与智能体开展标准知识挖掘提供一种创新方法。
付振秋;田辉
中国信息通信研究院信息通信融合创新中心,北京100191 泰尔融创(北京)科技有限公司,北京100191中国信息通信研究院信息通信融合创新中心,北京100191 泰尔融创(北京)科技有限公司,北京100191
计算机与自动化
标准文本关键词提取歧义
《信息通信技术与政策》 2025 (2)
P.87-96,10
评论