首页|期刊导航|信息通信技术与政策|基于多算法融合的标准文本关键词提取与歧义处理方法研究

基于多算法融合的标准文本关键词提取与歧义处理方法研究OA

中文摘要

首先,基于多算法融合的标准文本关键词提取与歧义处理方法基于TF-IDF和TextRank相结合,同时在考虑词语位置、词性、词长与词频的基础上完成标准文本的关键词提取;然后,利用Hanlp对相同文本进行处理,并完成对比歧义处理。通过试验结果分析,该方法对于标准文本的关键词提取与歧义处理的效率提升、处理质量有显著效果,也为大模型结合知识库与智能体开展标准知识挖掘提供一种创新方法。

付振秋;田辉

中国信息通信研究院信息通信融合创新中心,北京100191 泰尔融创(北京)科技有限公司,北京100191中国信息通信研究院信息通信融合创新中心,北京100191 泰尔融创(北京)科技有限公司,北京100191

计算机与自动化

标准文本关键词提取歧义

《信息通信技术与政策》 2025 (2)

P.87-96,10

10.12267/j.issn.2096-5931.2025.02.014

评论

您当前未登录!去登录点击加载更多...