MICHAC:通过基于最大信息系数和分层聚集聚类的特征选择进行缺陷预测

上传者: 38659374 | 上传时间: 2022-12-28 17:17:59 | 文件大小: 271KB | 文件类型: PDF
缺陷预测旨在通过从历史缺陷数据中学习来估计软件的可靠性。 缺陷预测方法根据从软件项目中提取的指标来识别软件模块是否容易出现缺陷。 这些度量值(也称为特征)可能涉及不相关和冗余,这将损害缺陷预测方法的性能。 现有工作采用特征选择来预处理缺陷数据以滤除无用的特征。 在本文中,我们提出了一种新颖的特征选择框架MICHAC,它是通过层次聚类聚类通过最大信息系数进行缺陷预测的简称。 MICHAC分为两个主要阶段。 首先,MICHAC利用最大信息系数对候选特征进行排序,以过滤掉不相关的特征;其次,MICHAC通过分层聚集聚类对特征进行分组,并从每个结果组中选择一个特征以去除冗余特征。 我们使用三个具有四个性能指标(精度,召回率,F量度和AUC)的不同分类器,对11个被广泛研究的NASA项目和四个开源AEEEM项目评估了我们提出的方法。 与五种现有方法的比较表明,MICHAC可有效选择缺陷预测中的特征。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明