首页|期刊导航|北京测绘|基于音形码的地名地址数据相似度计算与去重方法

基于音形码的地名地址数据相似度计算与去重方法OA

Similarity calculation and duplication method of geographical name and address data based on phonetic code

中文摘要英文摘要

重复数据的处理是地名地址数据治理时一项重要的任务.本文针对广东省地名地址数据库存在的重复数据的问题,提出了一种基于音形码汉字相似度的计算方法,介绍了基于音形码地名地址去重的原理、流程和方法,并结合相关原理开发地名地址数据去重软件.以荔湾区地名地址数据为实验数据,通过软件计算荔湾区地名地址数据库中数据的相似度,结合去重规则和距离的差异进行数据判断,解决地名地址数据库重复的问题,保证数据库的准确性.实验结果表明,该软件对重复数据的匹配程度较高,地名地…查看全部>>

The processing of duplicate data is an important task in the management of geographical name and address data.To address the problem of duplicate data in the geographical name and address database of Guangdong Province,this paper proposed a method to calculate Chinese character similarity based on phonetic codes and introduced the principle,process,and method of de-duplication of geographical names and addresses based on phonetic codes.In addition,according …查看全部>>

严海峰;简梓红;江秀明

广东省地图院,广东 广州 510075广东省地图院,广东 广州 510075广东省测绘工程有限公司,广东 广州 510663

测绘与仪器

地名地址音形码相似度距离去重

geographical name and addressphonetic codesimilaritydistancededuplication

《北京测绘》 2024 (9)

1271-1276,6

广东省科技计划(2021B1111610001)

10.19580/j.cnki.1007-3000.2024.09.006

评论

您当前未登录!去登录点击加载更多...