上传者: 42138376
|
上传时间: 2022-03-23 19:59:16
|
文件大小: 282KB
|
文件类型: -
恶意软件分类
机器学习和恶意软件分类
基于API调用序列,主要是n-gram和tfidf特征
机器学习工具用的lightgbm
恶意软件根据API序列分类
使用机器学习方法对恶意软件类型进行分类
大多数功能是从API序列中提取的
使用n-gram和tfidf提取向量
您可以从该下载火车
程序介绍
file_split.py读取csv文件,并按照不同的文件ID组织
preprocess.py可以重新导入每个文件,转成json格式,和序列化api
basic_feature.py提取简单特征
tfidf_model.py生成tfidf模型
feature.py利用生成的tfidf模型转换训练和测试数据
light_gbm_model.py模型调参
model_predict.py结果预测
说明
这是参加第三届『阿里云安全算法挑战赛』源代码,最后成绩在Top30以内,不在Top10以内。
因为