基于BalanceCascade-GBDT算法的类别不平衡虚假评论识别方法OA
Detection of Class-Imbalance Spam Reviews Based on BalanceCascade-GBDT Algorithm
虚假评论是电商发展过程中一个无法避免的难题.针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法.BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器.GBD T以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型.模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以…查看全部>>
陶朝杰;杨进
上海理工大学理学院 ,上海 200093上海理工大学理学院 ,上海 200093
信息技术与安全科学
虚假评论类别不平衡GBDTBalanceCascsde机器学习
《经济数学》 2020 (3)
214-220,7
教育部人文社科规划基金项目(16YJA630037)上海市一流学科建设项目(S1201YLXK)
评论