在数据分类中,没有特定的分类器在每种情况下都能保持一致的性能。 对于高维数据集和类不平衡数据集,这甚至更糟。 为了克服类不平衡数据的局限性,我们使用随机子采样来拆分数据集以平衡它们。 然后,我们应用(alpha,beta)-k特征集方法来选择更好的特征子集,并将它们的输出合并以获得用于分类器训练的合并特征集。 为了提高分类性能,我们提出了一组分类器,该分类器使用最简单且使用最多的多数表决方法将基本分类器的分类输出组合在一起。 我们没有使用所有基本分类器来创建集合,而是实现了一种遗传算法(GA),以从异构基本分类器中搜索最佳组合。 通过所提出的方法对所选数据集进行分类的性能是有希望的。
2021-04-29 17:05:14
65KB
开源软件
1