首页|期刊导航|计算机与数字工程|CSSAQP:一种基于聚类的分层抽样近似查询处理算法

CSSAQP:一种基于聚类的分层抽样近似查询处理算法OACSTPCD

CSSAQP:An Approximate Query Algorithm Based On Clustering Stratified Samping

中文摘要英文摘要

近似查询处理技术常被应用于海量数据的多维分析,以缩短查询执行的时间,同时返回尽可能准确的结果.由于海量数据中常存在许多极端值,会严重影响近似查询处理的结果.因此针对海量数据的聚集操作,论文提出CSSAQP算法,先将原始数据集按某一数值列直观的聚为三类,分别代表大值簇、小值簇和常值簇,再对各簇按分组属性分别进行分层抽样,构建总体样本集,最后通过查询重写在总体样本集上执行查询,以缩短海量数据聚集操作的查询时间,同时提高查询任务的准确性.通过实验验证,…查看全部>>

The approximate query processing technique is often applied to multidimensional analysis of massive data to short?en the execution time of the query and return the results as accurate as possible. Because of many extreme values in massive data,it will seriously affect the results of approximate query processing. Therefore,for the aggregation of massive data,this paper proposes a algorithm CSSAQP,which first clustered the original data set into three ca…查看全部>>

谢金星;李晖;陈梅;戴振宇

贵州大学先进计算与医疗信息服务工程实验室 贵阳 550025贵州大学先进计算与医疗信息服务工程实验室 贵阳 550025贵州大学先进计算与医疗信息服务工程实验室 贵阳 550025贵州大学先进计算与医疗信息服务工程实验室 贵阳 550025

信息技术与安全科学

近似查询处理聚集查询聚类分层抽样

AQPaggregate queryclusteringstratified sampling

《计算机与数字工程》 2017 (6)

面向FAST的海量数据处理关键技术研究

1121-1126,6

国家自然科学基金项目(编号:61462012,61562010,U1531246)基于云计算的医疗信息管理系统关键技术研究及应用(编号:GY[2014]3018)贵州省重大应用基础研究项目(编号:JZ20142001)贵州省教育厅自然科学项目(编号:黔科合人才团队字[2015]53号)贵州大学研究生创新基金(院级)资助.

10.3969/j.issn.1672-9722.2017.06.023

评论

您当前未登录!去登录点击加载更多...