首页|期刊导航|计算机工程与应用|一种适合不平衡数据集的新型提升算法

一种适合不平衡数据集的新型提升算法OACSCDCSTPCD

New algorithm of AdaBoost for unbalanced datasets

中文摘要英文摘要

提出了一种新的适用于不平衡数据集的Adaboost算法(ILAdaboost),该算法利用每一轮学习到的基分类器对原始数据集进行测试评估,并根据评估结果将原始数据集分成四个子集,然后在四个子集中重新采样形成平衡的数据集供下一轮基分类器学习,由于抽样过程中更加倾向于少数类和分错的多数类,故合成分类器的分界面会偏离少数类.该算法在UCI的10个典型不平衡数据集上进行实验,在保证多数类分类精度的同时提高了少数类的分类精度以及GMA.

A new training method of AdaBoost(ILAdaboost) which is good for unbalanced datasets is proposed in this paper. The algorithm evaluates the original data with the base classifier of each iteration.It divides the original dataset into four subsets, and then re-samples in the four subsets to form the balanced datasets, using for the base classifier learning in the next iteration.Due to the inclination to the minority and the false classified majority in the pro…查看全部>>

王灿伟;于治楼;张化祥

山东师范大学信息科学与工程学院,济南250014山东工会管理干部学院信息工程学院,济南250100山东省分布式计算机软件新技术重点实验室,济南250014

信息技术与安全科学

不平衡数据集集成学习AdaBoost重采样

unbalanced datasetensemble learningAdaBoostre-sample

《计算机工程与应用》 2011 (28)

169-172,175,5

山东省科技研院计划项目(No.2007ZZ17,No.2008GG 10001015,No.2008B0026,No.ZR2010FM021)山东省教育厅科研项目(No.J09LG02).

10.3778/j.issn.1002-8331.2011.28.046

评论

您当前未登录!去登录点击加载更多...