首页|期刊导航|重庆大学学报|基于机器学习的软件缺陷预测研究

基于机器学习的软件缺陷预测研究OA北大核心

Research on software defect prediction based on machine learning

中文摘要英文摘要

在机器学习技术逐渐渗透到各个领域的背景下,软件开发流程中的软件测试非常重要,面对在软件缺陷预测过程中出现的类别不平衡和准确性问题,提出一种基于监督学习的解决方案,采用样本平衡技术,结合合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)与编辑最近邻(edited nearest neighbor,ENN)算法,对局部加权学习(local weight learning,LWL)、J48、C4.8、随机森林、贝叶斯网络(Bayes net,BN)、多层前馈神经网络(multilayer feedforward neural network,MFNN)、支持向量机(supported vector machine,SVM)以及朴素贝叶斯(naive Bayes key,NB-K)等多种算法进行测试.这些算法被应用于NASA数据库的3个不同数据集(KK1,KK3,PK2),并对其效果进行详细比较分析.研究结果显示,结合了SMOTE和ENN的随机森林模型在处理类别不平衡问题方面展现出高效且避免过拟合的优势,为解决软件缺陷预测中的类别不平衡提供了一种有效的解决方案.

With the gradual penetration of machine learning technology into various fields,software testing in the software development process is very important.Software defect prediction faces class imbalance problem and accuracy issue.This paper proposes a supervised learning-based software prediction method for solving these two core problems.The method adopts sample balancing technique,combined with synthetic minority over-sampling technique(SMOTE)and edited nearest neighbor(ENN)algorithm,to test local weight learning(LWL),J48,C4.8,random forest,Bayes net(BN),multilayer feedforward neural network(MFNN),supported vector machine(SVM),and naive Bayes key(NB-K).These algorithms are applied to three different datasets(KK1,KK3 and PK2)in the NASA database and their effects are compared and analyzed in detail.The results show that the random forest model combining SMOTE and ENN exhibits high efficiency and avoiding overfitting in dealing with class imbalance problems,which provides an effective way to solve the problem in software defect prediction.

喻皓;张莹;李倩;姜立标;尚云鹏

广汽埃安新能源汽车股份有限公司研发中心,广州 511400星河智联汽车科技有限公司,广州 510335工业和信息化部电子第五研究所,广州 510463广州城市理工学院 机械工程学院与机器人学院,广州 510800||华南理工大学 机械与汽车工程学院,广州 510641广州城市理工学院 工程研究院,广州 510800

计算机与自动化

软件缺陷预测机器学习类不平衡XGBoost随机森林

software defect predictionmachine learningclass imbalanceXGBoostrandom forest

《重庆大学学报》 2025 (2)

10-21,12

国家自然科学基金(61602345).Supported by National Natural Science Foundation of China(61602345).

10.11835/j.issn.1000-582X.2025.02.002

评论