选择恶意和正常URL链接数据进行研究(特征选择、算法选择),并编写代码构建模型,最终满足如下需求: - 打印出模型的准确率和召回率; - 代码可以根据输入的URL自动判定其安全性;
2023-02-27 17:20:21 21.46MB 数据挖掘
1
针对随机森林(RF,random forest)算法的投票原则无法区分强分类器与弱分类器差异的缺陷,提出一种加权投票改进方法,在此基础上,提出一种检测 Android 恶意软件的改进随机森林分类模型(IRFCM,improved random forest classification model)。IRFCM选取AndroidManifest.xml文件中的Permission信息和Intent信息作为特征属性并进行优化选择,然后应用该模型对最终生成的特征向量进行检测分类。Weka 环境下的实验结果表明IRFCM具有较好的分类精度和分类效率。
1
聊天室源码,文字颜色、表情图片 用户可以在线管理、服务器端高级管理 支持私聊、用户聊天内容屏蔽,防恶意骚扰
2022-12-22 13:47:16 3.87MB 聊天室 源码
1
基于词向量和cnn的恶意邮件检测防钓鱼
2022-12-19 17:00:34 59.46MB 词向量 cnn 恶意邮件检测 防钓鱼检测
基于机器学习和深度学习的项目,内含数据集以及详细的备注源码
2022-12-18 14:27:50 302KB 机器学习 深度学习
基于深度学习和机器学习的恶意软件检测算法 内含数据集以及训练预测脚本
2022-12-13 15:00:33 29.97MB 恶意软件 深度学习 机器学习 网络安全
基于机器学习和深度学习的恶意域名检测算法 DGA:恶意域名生成算法 内含数据集以及训练脚本
2022-12-13 15:00:33 17.59MB 恶意域名 DGA 深度学习
基于词嵌入和cnn的恶意短信检测
2022-12-13 15:00:29 27.68MB 词嵌入 恶意短信 网络安全
基于开源URL数据字符串特征的恶意性检测项目源码+数据集+模型+项目说明.7z 从kdnuggets上收集到了带标签(good/bad)的URL数据集,共416350条,其中异常数据(bad)71556条,占比17.19%; 正常数据(good)344794条,占比82.81%。 将全体数据划分为训练集(70%),验证集(15%)和测试集(15%),并且在每个集合中均保持异常数据所占比例相同。 分类器模型 准确度(%) 精确度(%) 召回率(%) 贝叶斯 85.88 60.82 50.25 AdaBoost 92.84 86.05 69.65 随机森林 97.13 95.9 87.05 决策树 94.63 83.9 85.11 逻辑回归 90.86 83.29 58.58 梯度提升树 96.35 93.7 84.45 基于投票的分类器 97.1 92.51 90.48
来自微软的大型恶意软件数据集,在原始数据中,我们有二进制和asm文件 来自微软的大型恶意软件数据集,在原始数据中,我们有二进制和asm文件 来自微软的大型恶意软件数据集,在原始数据中,我们有二进制和asm文件
2022-12-13 11:30:10 62.03MB 数据集 软件 深度学习 恶意