基于统计显著性检验的高效用项集挖掘算法OA北大核心CSTPCD
Mining high utility itemsets based on statistical significance testing
针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法.这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算法根据项集自身的频率分布生成零分布,PHUI算法根据事务内置换策略或事务间置换策略构造置换事务集合来生成零分布.最后,FHUI和PHUI算法从零分布中计算出p值并运用错误发现率剔除假阳性高效用项集.基准事务集合实验结果显…查看全部>>
Aiming at the problem of traditional high utility itemset mining algorithms reporting false positive high utility item-sets in transactions with class labels,this paper proposed two high utility itemset mining algorithms called FHUI and PHUI.The FHUI and PHUI firstly found all the candidates and grouped them by length.Then,the FHUI established null distribu-tions with the frequency distributions,while the PHUI established null distributions by the perm…查看全部>>
吴军;魏丹丹;欧阳艾嘉;王亚
遵义师范学院信息工程学院,贵州遵义 563000遵义师范学院信息工程学院,贵州遵义 563000遵义师范学院信息工程学院,贵州遵义 563000遵义师范学院信息工程学院,贵州遵义 563000
计算机与自动化
数据挖掘高效用项集挖掘统计显著性检验Fisher检验置换检验
data mininghigh utility itemset miningstatistical significance testingFisher testingpermutation testing
《计算机应用研究》 2024 (10)
2970-2977,8
国家自然科学基金资助项目(62066049)贵州省教育厅高等学校青年资助项目(黔教技[2022]313,黔教合KY[2022]015)贵州省科技厅科技支撑计划资助项目(黔科合支撑[2023]257)遵义市科技合作资助项目(遵市科合HZ字(2022)123)
评论