基于均衡聚类索引的近似最近邻检索方法OA北大核心CSTPCD
大数据时代,深度学习通过将复杂对象表示为高维特征向量,并使用向量之间的距离度量来衡量样本的相似性,在推荐系统、用户画像、数据中台管理等场景中得到了广泛的应用.但是,随着数据规模的不断增加,海量特征数据的相似向量检索面临着检索模型占用内容大、特征检索算法召回率较低的严重挑战.如何在保证检索精度的前提下,设计紧凑型索引图结构,降低特征检索的内存消耗,对于提升大数据系统的近邻检索效率具有重要的作用.因此,本文提出了一种均衡感知的快速K均值近邻聚类的特征…查看全部>>
吕宏伟;李博;刘普凡;刘识;李继伟;刘俊健
国家电网大数据中心,江苏南京210023国家电网大数据中心,江苏南京210023国家电网大数据中心,江苏南京210023国家电网大数据中心,江苏南京210023国家电网大数据中心,江苏南京210023国家电网大数据中心,江苏南京210023
计算机与自动化
大数据检索与分析最近邻搜索均衡感知
《南京师大学报(自然科学版)》 2024 (2)
P.99-108,10
国家电网有限公司大数据中心自建科技项目(SGSJ0000SJJS2310021).
评论