缺陷预测旨在通过从历史缺陷数据中学习来估计软件的可靠性。 缺陷预测方法根据从软件项目中提取的指标来识别软件模块是否容易出现缺陷。 这些度量值(也称为特征)可能涉及不相关和冗余,这将损害缺陷预测方法的性能。 现有工作采用特征选择来预处理缺陷数据以滤除无用的特征。 在本文中,我们提出了一种新颖的特征选择框架MICHAC,它是通过层次聚类聚类通过最大信息系数进行缺陷预测的简称。 MICHAC分为两个主要阶段。 首先,MICHAC利用最大信息系数对候选特征进行排序,以过滤掉不相关的特征;其次,MICHAC通过分层聚集聚类对特征进行分组,并从每个结果组中选择一个特征以去除冗余特征。 我们使用三个具有四个性能指标(精度,召回率,F量度和AUC)的不同分类器,对11个被广泛研究的NASA项目和四个开源AEEEM项目评估了我们提出的方法。 与五种现有方法的比较表明,MICHAC可有效选择缺陷预测中的特征。
2022-12-28 17:17:59 271KB 研究论文
1
基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料.zip基于机器学习的软件缺陷预测系统源码+全部数据资料
对跨项目缺陷预测问题展开了深入研究,在源项目实例选择时,考虑了三种不同的实例相似度计算方法,并发现这些方法的缺陷预测结果存在多样性,因此提出了一种基于Box-Cox转换的集成跨项目软件缺陷预测方法BCEL。具体来说,基于不同的实例相似度计算方法,从候选集中选出不同的训练集;针对这些数据集,进行有针对性的Box-Cox转换,并借助特定分类方法构造出不同的基分类器,最后将这三个基分类器进行有效集成。基于实际项目的数据集,验证了BCEL方法的有效性,并深入分析了BCEL方法内的影响因素对缺陷预测性能的影响。
1
1、NASA MDP 软件缺陷数据集介绍:软件缺陷预测研究中心广泛应用NASA公布的NASA IV&V Facility Metrics Data Program(MDP)数据集。 MDP包括 13个不同的数据集,这些数据均来自NASA 的13个实际软件项目,由最常见的开发语言编写。每个数据集包含来自不同软件项目的若干模块,规模从 125个模块到 17186 个模块不等。各个数据集由LOC、McCabe、Halstead等几类度量元属性和是否包含缺陷的类别标记(defective)组成。MDP数据集所提供的记录,一行代表一个模块,每个字段对应一个属性。 2、NASA MDP 数据集是软件缺陷预测使用的数据集; 3、该数据集是向官方索取的,包含13个数据集文件,用于实验研究; 4、数据集文件格式是arff格式。
2022-04-17 12:00:21 788KB 软件缺陷预测 软件安全 机器学习
基于特征选择的软件缺陷预测方法.pdf
2022-04-06 00:22:59 1.01MB 技术文档
基于遗传优化支持向量机的软件缺陷预测模型,王男帅,薛静锋,有效的软件缺陷预测能够显著提高软件安全测试的效率,确保软件质量,支持向量机(support vector machine, SVM)具有非线性运算能力,是建立�
2022-02-22 11:17:06 332KB 软件安全
1
这是敏捷开发估算的一种算法,非常有用 Gompertz模型预测模板使用说明 1 灰色的单元格为自动计算出来的,不需要填写。其他白色的单元格需要手工填写。 2 样本点的个数不能超过1000,如果超过了1000,需要重新定义公式 3 遗留缺陷率是项目组的目标,可以自己设定,通常情况,针对4、5级的软件公司,此值应该小于等于5%。 4 需要拷贝进来每次测试发现的缺陷数。 5 将测试序号与累计发现的缺陷数两列拷贝到1stopt中,计算出K,a,b,填写到本表中 6 K为缺陷个数的上限,Ka为测试启动时首次发现的缺陷个数的拟合值,b表征了曲线到达顶峰的速度。 7 还需要的测试次数是用最后三次测试出的缺陷的平均数作为后续每次测试发现的缺陷的个数作为分母,然后用剩余应发现的缺陷个数除以之。 8 任意缺陷值预测是指想知道累计的发现缺陷数等于某个值时,需要执行的测试次数。此功能并非一定需要执行,可以忽略。 9 缺陷快速上升的拐点y值为K/e。计算原理可以自行查阅资料。
2021-10-09 10:36:44 418KB Gompertz模型 缺陷预测
1
软件缺陷预测综述,张启航,武斌,软件缺陷预测是软件工程领域一个重要的问题,其结合人工智能方法对代码是否含有缺陷进行快速判断,提升了软件开发的效率和软件的
2021-10-08 23:29:15 440KB 首发论文
1
基于卷积神经网络的代价敏感软件缺陷预测模型.pdf
2021-09-25 22:05:44 1.48MB 神经网络 深度学习 机器学习 数据建模
包括15个项目的CK数据集,包括15个项目的CK数据集包括15个项目的CK数据集包括15个项目的CK数据集
2021-07-06 07:51:51 174KB dataset of software defect
1