融合多源异构数据的ICO欺诈预测与可解释分析模型OA北大核心
为了解决首次代币发行(ICO)欺诈检测研究中存在的特征建模单一、模型缺乏可解释性等问题,提出一种融合多源异构数据的ICO欺诈预测和可解释分析模型IICOFP。首先,融合ICO项目基本信息、评级分数、社交媒体等多源异构数据,通过Lasso特征选择和Tomek-Link欠采样更有效地实现对ICO的特征建模;其次,基于GBDT算法训练ICO欺诈预测模型,并引入SHAP框架从多个角度分析欺诈型ICO的影响因素,有力增强模型的可解释性。实验结果表明,该模型的准确率、精确率、召回率、F 1分数和AUC值分别达到87.76%、85.37%、90.52%、87.87%和87.82%,各项性能比已有的最佳模型提高了约2%~10%,验证了融合多源异构数据进行特征建模在ICO欺诈预测中的关键作用(实验数据及代码:https://github.com/Lujiarong1203/IICOFP)。
卢加荣;廖彬;刘怡;陈海龙
新疆财经大学统计与数据科学学院,乌鲁木齐830012贵州财经大学大数据统计学院,贵阳550025新疆医科大学公共卫生学院,乌鲁木齐830017新疆财经大学统计与数据科学学院,乌鲁木齐830012
计算机与自动化
首次代币发行(ICO)欺诈预测GBDT模型SHAP框架可解释性
《计算机应用研究》 2025 (2)
P.357-364,8
新疆社会经济统计与大数据应用研究中心项目(XJEDU2024J100)。
评论