基于开源URL数据字符串特征的恶意性检测项目源码+数据集+模型+项目说明.7z 从kdnuggets上收集到了带标签(good/bad)的URL数据集,共416350条,其中异常数据(bad)71556条,占比17.19%; 正常数据(good)344794条,占比82.81%。 将全体数据划分为训练集(70%),验证集(15%)和测试集(15%),并且在每个集合中均保持异常数据所占比例相同。 分类器模型 准确度(%) 精确度(%) 召回率(%) 贝叶斯 85.88 60.82 50.25 AdaBoost 92.84 86.05 69.65 随机森林 97.13 95.9 87.05 决策树 94.63 83.9 85.11 逻辑回归 90.86 83.29 58.58 梯度提升树 96.35 93.7 84.45 基于投票的分类器 97.1 92.51 90.48
一个基于机器学习的新闻标题分类系统源码+数据集+训练好的模型+项目操作说明_本科毕设项目.7z bert_base中文预训练模型训练NLPCC2017 Task2新闻标题分类数据集的句向量 【环境配置要求】 Python:3.8.13 操作系统:Windows 数据库:MySQL Web框架:Flask 模型训练:sklearn 1.Anaconda创建虚拟环境 conda create -n Graduation python=3.8 命令行切换到对应目录 2.安装第三方库 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple 3.将数据导入数据库 mysql -u root -p --local-infile=1 < D:\Bachelor_Graduation\Bachelor_Graduation.sql 【备注】主要针对正在做毕设的同学和需要项目实战的机器学习、深度学习cv图像识别模式识别方向学习者。 也可作为课程设计、期末大作业。
基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+项目说明.7z 附数据集下载链接,输入一张图片,输出驾驶员状态及概率 驾驶员状态识别如下 c0: 安全驾驶 c1: 右手打字 c2: 右手打电话 c3: 左手打字 c4: 左手打电话 c5: 调收音机 c6: 喝饮料 c7: 拿后面的东西 c8: 整理头发和化妆 c9: 和其他乘客说话 【使用工具】 OpenCV Matlibplot Pytorch TensorboardX 【代码介绍】 data_mean.py 统计训练图片的均值与标准差 splite_valid.py 分离验证集与训练集 visual_classes.py 浏览每个驾驶状态 visual_samples.py 浏览随机的样本 model_plot.py 利用_tensorboardX_进行模型的绘制........
基于机器学习算法实现对A股股票走势预测系统源码+数据集+项目说明.7z 数据集、源码、模型、 特征提取工程 A股股票走势预测系统
Task 1: Matlab程序实现iris数据集分类 - 工具包:libsvm。 - 4维特征空间,随机取100样本训练,50样本测试。 - 训练数据trainData,测试数据testData,训练样本真实标签 trainLabel,测试样本真实标签testLabel,测试样本预测标 签pred。 - 测试样本集accuracy-acc,混淆矩阵-C。 - 提高要求:分类结果与真实结果的可视化对比,编程实现计 算不同的分类结果评价指标。 实验一 1212 Task 2: Python程序实现iris数据集分类 - 工具包/库:sklearn.svm。 - 2维特征空间(前两维),取所有150个样本为训练 样本,取[x_min,x_max]×[y_min,y_max]所有网格 点为测试样本,查看使用不同svm时样本划分。 - 训练数据X,测试数据xx×yy,训练样本真实标签Y, 测试样本真实标签无,测试样本预测标签Z。
2022-12-13 08:56:49 361KB 机器学习
1
机器学习数据集
2022-12-12 19:46:18 89KB 机器学习 数据集
1
深度强化学习自动炒股 选取 `1002` 只股票,进行训练,共计 - 盈利: `44.5%` - 不亏不赚: `46.5%` - 亏损:`9.0%`
2022-12-12 16:27:40 8KB 深度强化学习 自动炒股 机器学习
rbf预测数学代码机器学习 使用MATLAB的经典机器学习问题的算法 没有使用机器学习包 Scratch提供的所有自行编写的源代码。 包含的主题: - Nearest Neighbor Methods (KNN Classification/Regression) - Clustering (K-Centers, DP-Centers) - Linear Methods: - LDA and Ridge Regression - Logistic Regression (SGD) - Support Vector Machine (SSGD) - Dimensionality Reduction using PCA - Kernel for SVM & Clustering 分类 Logistic回归和随机梯度下降算法 训练数据集:3个类,R ^ 4中的功能 SGD算法在迭代中的学习进展: 具有RBF内核的Binary-SVM 培训数据集和结果决策边界: SSGD算法在迭代中的学习进展: K最近邻居算法 训练数据集: 通过KNN算法进行的预测: 聚类 K均值算法 聚类结果:K = 3
2022-12-12 16:06:27 5.42MB 系统开源
1
机器学习(期末复习笔记):支持向量机,人工神经网络,决策树,强化学习
2022-12-12 14:26:10 23.86MB 机器学习 支持向量机 强化学习 决策树
1
内含数据集以及源码,可以作为初学者的练手项目
2022-12-12 13:26:14 4KB 医学分析 机器学习