基于多节点组合特征和模糊聚类的中文词义消歧方法OA北大核心CSTPCD
WORD SENSE DISAMBIGUATION METHOD BASED ON MULTI-NODE COMBINATION FEATURE AND FUZZY CLUSTERING
词义消歧是自然语言处理中的难点问题,为提高消歧效果,提出一种基于多节点组合特征的词义消歧方法.根据依存语法理论,选择歧义词的祖父+父亲+孩子节点组合,并将其作为消歧特征.利用模糊C均值聚类算法,建立消歧模型,最终确定歧义词词义类别.采用哈工大信息检索研究中心语言技术平台的词义语料进行实验.实验结果表明,相比现有的两种方法,该方法不仅使特征维度平均值分别降低了5和25,且F1值分别提高了1.56个百分点和0.84个百分点,在一定程度上提升了词义消歧效果.
贺佳;杜建强;聂斌;熊旺平;雷银香;罗计根;曾青霞
江西中医药大学计算机学院 江西 南昌 330004江西中医药大学计算机学院 江西 南昌 330004江西中医药大学计算机学院 江西 南昌 330004江西中医药大学计算机学院 江西 南昌 330004江西中医药大学计算机学院 江西 南昌 330004江西中医药大学计算机学院 江西 南昌 330004江西中医药大学岐黄国医书院 江西 南昌 330004
信息技术与安全科学
自然语言处理词义消歧多节点组合特征依存语法理论依存结构树模糊C均值聚类算法
《计算机应用与软件》 2021 (2)
融合Softmax回归和偏最小二乘的中药数据分析方法研究
152-157,220,7
国家自然科学基金项目(61562045,61762051)江西省科技厅重点研发计划项目(20171ACE50021) 江西省教育厅科学技术研究项目( GJJ170747 ).