1、内容概要:本资源主要使用深度学习相关方法构造漏洞分类模型进行实验调研。适用于初学者学习软件漏洞分类使用。本次实验使用的是从2002年到2019年5月份的NVD漏洞数据。详见资源nvdcve文件夹。
2、源代码文件说明
(1)xml_to_excel.py:漏洞数据预处理脚本,将xml格式NVD原始数据转换为excel格式的标准漏洞文件。
(2)vul_plot.py:统计和可视化漏洞数据脚本。nvd_dataset.py:获取前n个漏洞类型的数据脚本。features_keywords.py:特征提取脚本,训练集和测试集文本向量化。
(3)lstm_model.py:构建双向GRU分类模型Bi-GRU;C-LSTM串联模型;构建word2vec模型;数据预处理 ;指标评价可视化。
(4)cgru_model.py:TextCGRU串联,构建word2vec模型;数据预处理;指标评价可视化等。
3、figures文件夹包含模型图绘制,评价指标可视化。
4、nvdcve文件夹包含原始数据,预处理数据,词向量模型w2v_model.pkl和分类模型较大自己训练即可)。