本文讨论了使用机器学习进行恶意软件分类的方法,问题和解决方案。 可以相信,被释放的恶意软件的数量可能会超过权威软件的释放。 由于恶意软件每年都会变得越来越复杂,因此需要从传统方法转变为使系统自动学习。 这里的主要重点是研究机器学习方法以及它们的检测和分类问题。 说明了特征选择和高假阳性问题,并提出了解决方案。 然后将操作码,n-gram操作码,基于图像的分类技术进行比较。 这些方法将有助于清除恶意软件并将其分类到其家族中。 与常规操作码和基于图像的分类器相比,使用n-gram操作码分类时基于准确性的结果更好,但是使用集成方法结合了这两种方法的优点,例如,过拟合和FPR较低,最终结果显示出分类精度更高和提供总体上更好的恶意软件分类。
1