基于数据模糊性的PU学习研究OA北大核心CSCDCSTPCD
On positive and unlabeled learning based on data fuzziness
PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器…查看全部>>
李婷婷;吕佳
重庆师范大学计算机与信息科学学院,重庆市数字农业服务工程技术研究中心,401331,重庆重庆师范大学计算机与信息科学学院,重庆市数字农业服务工程技术研究中心,401331,重庆
信息技术与安全科学
PU学习模糊性可靠负例噪声点分类边界
《北京师范大学学报(自然科学版)》 2020 (1)
45-51,7
重庆市自然科学基金资助项目(cstc2014jcyjA40011)重庆市教委科技资助项目(KJ1400513)重庆师范大学科研资助项目(YKC19018)
评论