基于密度峰值聚类和相对距离的半监督自训练方法OA北大核心CHSSCDCSSCICSTPCD
半监督自训练方法属于半监督自标记方法的一种,它能同时利用有标记样本和无标记样本来训练分类器。然而,对半监督自训练方法而言,误标记是一个不容忽视的问题。为此,文章提出了一种基于密度峰值聚类和相对距离的半监督自训练方法(STDPRD)。在迭代的自训练过程中,STDPRD首先用密度峰值聚类来选取具有高置信度的无标记样本,再标记他们;其次,STDPRD用相对距离来过滤掉在迭代过程中被误标记的样本;然后,STDPRD把在迭代过程中被正确标记的样本加入有标记集中;最后,STDPRD用被扩充的有标记集来训练给定的分类器,训练完成后,输出被训练的分类器。仿真实验结果表明,在真实数据集上,STDPRD的表现优于4种流行的半监督自训练方法。
孙洁;景志敏;周欢;
重庆公共运输职业学院智能装备学院,重庆402247重庆能源职业学院汽车工程学院,重庆402260
半监督学习半监督分类相对距离误标记
《统计与决策》 2024 (017)
P.53-58 / 6
评论