男X
MaleX是恶意软件和良性Windows可执行文件示例的精选数据集,适用于恶意软件研究人员。 数据集包含1,044,394个Windows可执行二进制文件,其中864,669被标记为恶意软件,而179,725被标记为良性。 该数据集具有合理数量的样本,足以测试数据驱动的机器学习分类方法,还可以在可伸缩性和适应性方面衡量设计模型的性能。
频域中的恶意软件可视化
在频域中可视化恶意软件的动机是由于文学中恶意软件的“稀疏”特征表示形式,通常是从二进制文件的原始字节或反汇编的指令(n-gram,n-perms)中提取出来的。
将给定的可执行二进制文件读取为16位带符号十六进制向量,并将其划分为相应的二位字节(n-gram字节,n = 2)。 例如,对于字节流0a1bc48a ,对应的二元组将为0a1b , 1bc4和c48a 。 然后,我们使用二元语法频率计数来获得尺寸为256x256的
2021-09-16 20:00:18
228KB
1