首页|期刊导航|东南大学学报(自然科学版)|基于Logistic回归和XGBoost的钓鱼网站检测方法

基于Logistic回归和XGBoost的钓鱼网站检测方法OA北大核心CSCDCSTPCD

Phishing website detection method based on logistic regression and XGBoost

中文摘要

为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,构建了XGBoost分类模型,给出了方法的时间复杂度分析,采集了真实数据作为实验数据集.实验结果表明,Logis-tic回归方法降低了融合特征的维度,检测速度优于直接融合方法;融合特征方法比…查看全部>>

杨鹏;曾朋;赵广振;吕培培

东南大学计算机科学与工程学院,南京211189东南大学计算机网络和信息集成教育部重点实验室,南京211189

信息技术与安全科学

钓鱼网站Logistic回归集成学习XGBoost

《东南大学学报(自然科学版)》 2019 (2)

具有互补双结构的新型网络及关键技术研究

207-212,6

国家自然科学基金资助项目(61472080)、中国工程院咨询研究资助项目(2018-XY-07)、软件新技术与产业化协同创新中心资助项目.

10.3969/j.issn.1001-0505.2019.02.001

评论

您当前未登录!去登录点击加载更多...