首页|期刊导航|电子学报|一种基于Tri-training的众包标记噪声纠正算法

一种基于Tri-training的众包标记噪声纠正算法OA北大核心CSCD

A Tri-training-Based Label Noise Correction Algorithm for Crowdsourcing

中文摘要

在众包学习中,使用标记集成算法得到的集成标记中仍然存在一定程度的标记噪声.本文受三重训练思想的启发,提出了一种基于tri-training的众包标记噪声纠正算法(Tri-Training-based Label Noise Correction,TTLNC).TTLNC首先使用过滤器获得干净集和噪声集,然后在干净集上进行bagging分别训练三个不同的分类器,并通过这些分类器重新标注噪声集中的实例,同时按照实例分配策略将实例分配给相应的训练集.最后在新训练集上重新训练三个不同的分类器,并用新分类器的分类结果重新标注所有实例.在仿真标准数据和真实众包数据集上的实验结果表明TTLNC比其他四种最先进的噪声纠正算法在噪声比和模型质量两个度量指标上表现更优.

杨艺;蒋良孝;李超群;李宏伟

中国地质大学计算机学院,湖北武汉 430074中国地质大学计算机学院,湖北武汉 430074智能地学信息处理湖北省重点实验室(中国地质大学),湖北武汉 430074中国地质大学数学与物理学院,湖北武汉 430074

信息技术与安全科学

众包学习三重训练集成标记标记噪声噪声纠正噪声过滤

《电子学报》 2021 (3)

424-434,11

国家自然科学基金联合基金(No.U1711267)中央高校基本科研业务费专项资金(No.CUGGC03)

10.12263/DZXB.20200337

评论