多示例学习的簇频繁性分析及双角度融合嵌入OA北大核心CSTPCD
多示例学习(Multi-Instance Learning,MIL)的训练数据是由若干个未带标记的示例组成的带标记的包,基于嵌入的方法,通过将包嵌入成单向量来解决包表示问题,然而大部分现有方法忽略了示例与包的联系,难以保证所选示例的代表性.同时,单角度的嵌入方法无法有效地提取正、负包的差异信息,使嵌入向量的质量较差.提出一种多示例学习的簇频繁性分析及双角度融合嵌入(FADE).簇频繁性分析技术从正、负子空间中分别筛选部分示例作为子空间的簇心,依据簇心将子空间聚类成簇,再计算簇频繁性指标,选择频繁性较高的簇的簇心组成子空间代表示例集.双角度融合嵌入技术基于正、负子空间代表示例集和差值嵌入函数,分别从正、负角度挖掘信息,融合两个角度信息获得最终的嵌入向量.在29个数据集上与七个MIL算法进行了对比实验,结果表明,FADE的分类准确率总体上优于七个对比算法,在图像数据集上有显著优势,在文本和网页数据集上也表现良好.
杨梅;张靖宇;闵帆;方宇;
西南石油大学计算机与软件学院,成都610500 西南石油大学人工智能研究院,成都610500 西南石油大学机器学习研究中心,成都610500西南石油大学计算机与软件学院,成都610500
计算机与自动化
多示例学习嵌入方法簇频繁性示例来源双角度融合
《南京大学学报(自然科学版)》 2024 (004)
P.531-541 / 11
南充市-西南石油大学市校科技战略合作专项资金(23XNSYSX0084,23XNSYSX0062);浙江省海洋大数据挖掘与应用重点实验室开放课题(OBDMA202102);国家自然科学基金(61976194)。
评论