基于用户查询与样本间匹配度评估的分层抽样策略OA北大核心CSTPCD
A STRATIFIED SAMPLING APPROACH BASED ON MATCHING DEGREE EVALUATION BETWEEN USER QUERY AND SAMPLE SET
在数据探索性分析场景下,用户倾向于借助抽样系统获取近似查询结果来换取更快的查询速度.现有的抽样系统通常假设用户的历史查询记录能很好地表征未来的查询情况,从而针对特定的查询特征生成特定的抽样策略.然而,在现实场景中,用户探索意图变化丰富,用户查询特征的稳定性假设通常无法得到保证.为解决上述问题,提出一种评估任意用户查询与样本间匹配度的方法.离线训练生成多份样本集,并在应对具体查询时自动选取最匹配样本集进行近似结果计算.离线样本集的生成是以在所有可能…查看全部>>
邬志罡;荆一楠;何震瀛;王晓阳
复旦大学计算机科学技术学院 上海 201203上海市数据科学重点实验室(复旦大学) 上海 200433复旦大学计算机科学技术学院 上海 201203上海市数据科学重点实验室(复旦大学) 上海 200433
信息技术与安全科学
抽样系统近似查询处理分层抽样优化问题
《计算机应用与软件》 2019 (8)
面向复杂查询的异质媒体搜索理论与方法研究
196-202,7
国家自然科学基金项目(61732004)国家重点研发计划项目(2018YFB1004404)上海科技创新行动计划项目(16DZ11002001).
评论