一种基于样本学习复杂度的不平衡数据过采样方法OACSTPCD
An Oversampling Method for Imbalanced Data Based on Learning Complexity of Samples
在人们的生活中存在大量的不平衡数据,如何识别人们感兴趣的少数类是一个具有挑战性的问题.论文基于ADASYN算法中提出的样本学习复杂度的思想,设计了一种新的过采样方法LDSMOTE.在该方法中,少数类主样本的学习复杂度与该主样本在少数类和多数类样本空间的分布都有关,ADASYN只利用了邻域多数类样本分布信息,而LDSMOTE融合了局部少数类平均距离和局部多数类样本数的信息.不同于ADASYN中复杂度是离散值,论文中的复杂度是连续的值,更能表现不同主…查看全部>>
许皓;孙廷凯
南京理工大学计算机科学与工程学院 南京 210094南京理工大学计算机科学与工程学院 南京 210094
天文与地球科学
过采样不平衡数据主样本学习复杂度样本分布
《计算机与数字工程》 2020 (8)
1846-1851,1857,7
评论