NSL-KDD数据集是KDD99数据集的改进,可以作为有效地基准数据集,各机器学习算法可以在NSL-KDD数据集上进行入侵检测实验。
NSL-KDD数据集是KDD 99数据集的改进:
1、NSL-KDD数据集的训练集中不包含冗余记录,所以分类器不会偏向更频繁的记录;
2、NSL-KDD数据集的测试集中没有重复的记录,使得检测率更为准确。
3、来自每个难度级别组的所选记录的数量与原始KDD数据集中的记录的百分比成反比。结果,不同机器学习方法的分类率在更宽的范围内变化,这使得对不同学习技术的准确评估更有效。
4、训练和测试中的记录数量设置是合理的,这使得在整套实验上运行实验成本低廉而无需随机选择一小部分。因此,不同研究工作的评估结果将是一致的和可比较的。