|国家科技期刊平台
首页|期刊导航|自动化学报|非平衡概念漂移数据流主动学习方法

非平衡概念漂移数据流主动学习方法OA北大核心CSTPCD

中文摘要

数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法.

李艳红;王甜甜;王素格;李德玉;

山西大学计算机与信息技术学院,太原030006 山西大学计算智能与中文信息处理教育部重点实验室,太原030006

计算机与自动化

数据流分类主动学习概念漂移多类不平衡

《自动化学报》 2024 (003)

P.589-606 / 18

国家重点研发项目(2022QY0300-01);国家自然科学基金(62076158);山西省基础研究计划项目(202203021221001)资助。

10.16383/j.aas.c230233

评论