面向下游任务优化的不平衡数据重采样OA
Resampling of Imbalanced Data for Optimizing Downstream Tasks
数据重采样是解决数据类别不平衡的一种重要方法.传统方法通过最小化样本空间的几何误差构建平衡样本,但在复杂分布模式的高维空间表现不佳,而且依赖统计特征的方式也缺乏对下游任务的针对性.为了解决这个问题,本文提出一种基于神经网络的数据采样模型SOD-NN.利用神经网络的非线性处理能力学习样本在高维空间中的分布特征,并与下游任务联合构造两阶段网络形成整体优化,提升采样过程对下游任务的拟合能力.采样时首先对数据集进行空间划分,得到的样本子集通过残差处理避免…查看全部>>
Data resampling is a key method for correcting imbalanced dataset.Traditional methods construct balanced samples by minimizing geometric errors in the sample space,but they perform poorly in high-dimensional space with complex distribu-tion patterns.Moreover,relying on statistical features lacks specificity for downstream tasks.To address this issue,this paper presents Sampling for Optimizing Downstream Neural Network(SOD-NN),a neural network for data sampli…查看全部>>
郭华
中国石油大学(华东)计算机科学与技术学院,山东 青岛 266580
计算机与自动化
数据重采样样本不平衡自适应采样网络自注意力机制
data resamplingimbalanced dataadaptive sampling networkself-attention mechanism
《计算机与现代化》 2025 (2)
28-32,51,6
山东省自然科学基金资助项目(ZR2020MF140)
评论