基于开源URL数据字符串特征的恶意性检测项目源码+数据集+模型+项目说明.7z 从kdnuggets上收集到了带标签(good/bad)的URL数据集,共416350条,其中异常数据(bad)71556条,占比17.19%; 正常数据(good)344794条,占比82.81%。 将全体数据划分为训练集(70%),验证集(15%)和测试集(15%),并且在每个集合中均保持异常数据所占比例相同。 分类器模型 准确度(%) 精确度(%) 召回率(%) 贝叶斯 85.88 60.82 50.25 AdaBoost 92.84 86.05 69.65 随机森林 97.13 95.9 87.05 决策树 94.63 83.9 85.11 逻辑回归 90.86 83.29 58.58 梯度提升树 96.35 93.7 84.45 基于投票的分类器 97.1 92.51 90.48
一个基于机器学习的新闻标题分类系统源码+数据集+训练好的模型+项目操作说明_本科毕设项目.7z bert_base中文预训练模型训练NLPCC2017 Task2新闻标题分类数据集的句向量 【环境配置要求】 Python:3.8.13 操作系统:Windows 数据库:MySQL Web框架:Flask 模型训练:sklearn 1.Anaconda创建虚拟环境 conda create -n Graduation python=3.8 命令行切换到对应目录 2.安装第三方库 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple 3.将数据导入数据库 mysql -u root -p --local-infile=1 < D:\Bachelor_Graduation\Bachelor_Graduation.sql 【备注】主要针对正在做毕设的同学和需要项目实战的机器学习、深度学习cv图像识别模式识别方向学习者。 也可作为课程设计、期末大作业。
基于深度学习实现驾驶员分心驾驶行为识别项目源码+数据集+模型+项目说明.7z 附数据集下载链接,输入一张图片,输出驾驶员状态及概率 驾驶员状态识别如下 c0: 安全驾驶 c1: 右手打字 c2: 右手打电话 c3: 左手打字 c4: 左手打电话 c5: 调收音机 c6: 喝饮料 c7: 拿后面的东西 c8: 整理头发和化妆 c9: 和其他乘客说话 【使用工具】 OpenCV Matlibplot Pytorch TensorboardX 【代码介绍】 data_mean.py 统计训练图片的均值与标准差 splite_valid.py 分离验证集与训练集 visual_classes.py 浏览每个驾驶状态 visual_samples.py 浏览随机的样本 model_plot.py 利用_tensorboardX_进行模型的绘制........
基于机器学习算法实现对A股股票走势预测系统源码+数据集+项目说明.7z 数据集、源码、模型、 特征提取工程 A股股票走势预测系统
基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip启动方式 环境启动 hadoop hive2元数据库 sql导入 导入hivesql脚本,修改application.yml 启动主程序 HadoopApplication 基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip启动方式 环境启动 hadoop hive2元数据库 sql导入 导入hivesql脚本,修改application.yml 启动主程序 HadoopApplication 基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip启动方式 环境启动 hadoop hive2元数据库 sql导入 导入hivesql脚本,修改application.yml 启动主程序 HadoopApplication 基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip启动方式 环境启动 hadoop hive2元数据库 sql导入 导入hivesql脚本,修改application.yml 启动主程序 HadoopApplication
R医学分析实例肝病诊断分析,word教程以及R源码数据集
2022-12-12 13:26:15 41KB 医学分析
一个完整端到端的机器学习项目__预测建筑物的能源得分(完整分步实现源码+数据集+项目介绍).zip 【项目介绍】 这是一个受监督的回归机器学习任务:给定一组包含目标(在本例中为分数)的数据,我们希望训练一个可以学习将特征(也称为解释变量)映射到目标的模型。 受监督问题: 我们可以知道数据的特征和目标,我们的目标是训练可以学习两者之间映射关系的模型。 回归问题: Energy Star Score是一个连续变量。 在训练中,我们希望模型能够学习特征和分数之间的关系,因此我们给出了特征和答案。然后,为了测试模型的学习效果,我们在一个从未见过答案的测试集上进行评估 【你的收获】 数据清理,探索性数据分析,特征工程和选择等常见问题的解决办法 随机搜索,网格搜索,交叉验证等方法寻找最优超参数 可视化决策树 对完整的机器学习项目流程建立一个宏观的了解!值得拥有!!!
基于计算机视觉和机器学习的人脸检测及人脸识别系统源码+数据资料.zip本项目是基于OpenCV2跨平台计算机视觉和机器学习软件库的人脸检测及人脸识别系统, 采用Web应用作为用户和管理的交互页面。 系统人脸识别模块的图像处理采用PIL(Python Image Library)。 BPL是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了 软件架构 Flask:Flask是一个使用 Python 编写的轻量级 Web 应用程序框架。 OpenCV2:OpenCV2是一个跨平台计算机视觉和机器学习软件库。 LayUI:layui(谐音:类UI) 是一款采用自身模块规范编写的前端 UI 框架,遵循原生 HTML/CSS/JS 的书写与组织形式,门槛极低,拿来即用。且是国人开发,拥有较为完善的中文文档。 Pymysql及PooledDB:PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库。DBUtils是一套Python数据库连接池包,并允许对非线程安全的数据库接口进行线程安全包装。
基于yolov5+大疆教育无人机Tello TT实现目标识别检测+追踪测距完整源码+数据集+训练好的模型+操作说明文档.7z 数据集目标是旗、圈识别 模型已经训练调优 请参考项目说明中的步骤来操作。 【备注】主要针对正在做毕设的同学和需要项目实战的深度学习cv图像识别模式识别方向学习者。 也可作为课程设计、期末大作业。包含:项目源码、训练好的模型、项目操作说明等,该项目可直接作为毕设使用。 也可以用来学习、参考、借鉴。如果基础不错,在此代码上做修改,训练其他模型。
R医学分析:某医院医疗费用分析 包括python源码和R语言源码
2022-12-09 16:27:54 21KB 医学分析 R python