针对传统机器学习方法不能有效地提取恶意代码的潜在特征,提出了基于栈式自编码(stacked auto encoder,SAE)的恶意代码分类算法。其次从大量训练样本中学习并提取恶意代码纹理图像特征、指令语句中的隐含特征;在此基础上,为提高特征选择对分类算法准确性的提高,将恶意代码纹理特征以及指令语句频度特征进行融合,训练栈式自编码器和softmax分类器。实验结果表明,基于恶意代码纹理特征以及指令频度特征,利用栈式自编码分类算法对恶意代码具有较好的分类能力,其分类准确率高于传统浅层机器学习模型(随机森林、支持向量机),相比随机森林的方法提高了2.474%,相比SVM的方法提高了1.235%。
2023-03-17 11:15:33 1.03MB 栈式自编码 恶意代码 分类
1
gee-Landsat影像 随机森林分类代码
2022-10-15 14:07:55 54KB gee 随机森林 代码 分类
门控图神经网络(GGNN)的Tensorflow实现,用于源代码分类 这是门控图神经网络(GGNN)的Tensorflow实现,如Y. Li,D.Tarlow,M.Brockschmidt和R.Zemel在论文《 )中所述。 缩短培训时间并加快收敛速度​​的技巧: 存储桶:将具有相似大小的批处理图放在一起,而不是随机混洗和批处理。 对于小图,请使用密集图表示;对于大图,请使用稀疏图表示。 我们根据的论文的详细信息,将文件解析为图形表示形式。 有关为方法名称预测实现的版本,请参阅此存储库: : 什么是GGNN? 解决图结构化数据和问题 门控传播模型(与GRU相同的想法),用于计算节点表示形式 展开固定步骤的重复周期,并在整个时间范围内使用反向传播 任务 代码分类 排序算法(SA数据集):从Github收集的10个排序问题,包括:插入排序,合并排序,拓扑排序,堆排序,冒泡排序,
2022-04-05 21:51:06 92.01MB 系统开源
1
为提高大规模恶意代码分类任务的分类准确率,提出基于词向量的恶意代码分类模型,引入NLP中表达语义含义的词向量概念,提取恶意代码函数语义特征,使用textCNN神经网络对其进行分类。实验结果表明,该模型在微软公司提供的BIG2015恶意代码分类比赛的训练集上能实现98.78%的预测准确率,相较几种传统方法准确率分别提高0.91%~3.16%。
2021-12-04 10:30:29 1.7MB 恶意代码; 分类; 词向量; CNN
1
Source Insight 黑色背景的模板,分类显示关键字、变量、宏、参数等,注释对中文支持不好等问题。
2021-08-16 22:50:23 130KB Source Insight
1
PTA的C++试题,含题目和代码,分类清晰
2021-07-04 18:02:14 38KB C++
1
本代码含随机森林的分类、回归代码,代码功能相当全面,性能良好,能够支撑项目开发和科研需要。---------
2021-05-30 21:45:31 442KB 机器学习 随机森林 MATLAB 图像分类
1
为了保护网页不被嵌入恶意代码,提出了一种基于网页文件代码分类检测技术的恶意代码检测系统,并完成了软件设计与开发。该系统采用J2EE技术开发,能够对网页文件进行代码分类扫描,并根据不同的扫描结果进行相应的处理。通过实际应用表明,采用代码分类检测技术能够高检出、低误报的识别出多种恶意代码,达到了设计要求。
2021-04-01 22:01:23 1.53MB 代码分类; 恶意代码检测; JSP; 脚本
1
中医病证代码分类及编码(95版): 1.中医疾病: 中医疾病分类代码 中医疾病分类名称 2.中医证候: 中医证候分类代码 中医证候分类名称
1
国家临床版2.0疾病诊断编码(ICD-10)国家临床版3.0手术操作编码(ICD-9-CM3)国家临床版2.0肿瘤形态学编码中医病证代码分类及编码(95版)(2020版).xlsx
1