1.项目利用Python爬虫技术,通过网络爬取验证码图片,并通过一系列的处理步骤,包括去噪和分割,以实现对验证码的识别和准确性验证。 2.项目运行环境:Python环境:需要Python 2.7配置,在Windows环境下下载Anaconda完成Python所需的配置,下载地址为https://www.anaconda.com/,也可以下载虚拟机在Linux环境下运行代码。 3.项目包括4个模块:数据爬取、去噪与分割、模型训练及保存、准确率验证。用request库爬虫抓取验证码1200张,并做好标注。图片爬取成功后进行去噪与分割。处理数据后拆分训练集和测试集,训练并保存。模型保存后,可以被重新使用,也可以移植到其他环境中使用。 4.准确率评估:测试结果精度达到99%以上。 5.项目博客:https://blog.csdn.net/qq_31136513/article/details/131571160
2024-04-28 10:40:57 23.11MB python 爬虫 机器学习 验证码识别
1
1.本项目采用百度地图API获取步行时间,基于GBDT模型对排队时间进行预测。实现用户自主选择多个目的地,系统输出最佳路线规划的结果,并根据用户的选择给出智能化推荐。 2.项目运行环境:需要Python 3.6及以上配置。 3.项目包括6个模块:数据预处理、客流预测、百度地图API调用、GUI界面设计、路径规划和智能推荐。选用GBDT建立模型,GBDT通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮的残差基础上进行训练;采用GBDT模型进行预测,输入当前天气、温度、风力风向、日期(是否是节假日、星期几)和时间即可得出当前客流量;当前客流量在后续预测排队时做一系列操作即可转换为排队时间;通过调用百度地图API模块产生节点之间的步行时间矩阵和客流模型,应用穷举法设计算法,得出最佳路线规划;系统将用户未选择的地点一次分别加入已选择的队列中进行运算,其基本思路与最佳路线规划模块一致,采用穷举法得到所有路线及其总耗时,最后将它们输出,实现智能推荐。 4.博客:https://blog.csdn.net/qq_31136513/article/details/133018114
2024-04-24 18:32:16 10.68MB 机器学习 python GBDT 最优路径
1
本项目基于朴素贝叶斯和SVM 分类模型,通过对垃圾邮件和正常邮件的数据训练,进行相关词汇词频的统计分析,实现垃圾邮件的识别功能。本项目包括3个模块:数据模块、模型构建、附加功能。需要Python 3.6 及以上配置,在Windows 环境下载Anaconda 完成Python 所需的配置,也可以下载虚拟机在Linux 环境下运行代码。从github 网站下载与python PIL 库配搭使用的文字引擎pytesseract,将PIL 文件夹里的.py 文件,改为相应pytesseract.exe 路径。注册百度云账号,分别建立图像文字识别和图像识别的小程序。
1
机器学习算法第二版 这是Packt发布的《 的代码库。 流行于数据科学和机器学习的算法 这本书是关于什么的? 机器学习以其强大而快速的大型数据集预测而获得了极大的普及。 但是,强大功能背后的真正力量是涉及大量统计分析的复杂算法,该算法搅动大型数据集并产生实质性见解。 本书涵盖以下激动人心的功能: 研究特征选择和特征工程过程 评估性能和误差权衡以进行线性回归 建立数据模型并使用不同类型的算法了解其工作方式 学习调整支持向量机(SVM)的参数 探索自然语言处理(NLP)和推荐系统的概念 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代码都组织在文件夹中。 例如,Chapter02。 该代码将如下所示: from sklearn.svm import SVC from sklearn.model_selection import cross_val_score svc =
2023-12-15 16:31:18 97KB Python
1
用于测试基于遥感影像的svm、随机森林、lightGBM等机器学习算法
2023-12-11 22:41:14 99.71MB 测试数据
1
机器学习算法的数学解析与Python实现.docx
2023-11-27 10:41:52 21KB
1
机器学习算法 高斯过程python包安装过程
2023-10-28 06:05:24 1KB 机器学习算法
1
数据集: Id R F M 1 27 6 232.61 2 3 5 1507.11 3 4 16 817.62 4 3 11 232.81 5 14 7 1913.05 6 19 6 220.07 7 5 2 615.83 8 26 2 1059.66 9 21 9 304.82 10 2 2 1227.96 11 15 2 521.02 代码: # -*- coding: utf-8 -*- # @File : k-means.py # @Date : 2020-02-18 9:58 # @Author : admin
2023-10-15 11:51:17 123KB em ema man
1
1.项目基于机器学习算法,通过对单模型和融合模型计算所得的指标进行对比,实现小分子在人体内清除率指标的预测。 2.项目运行环境:Python环境、安装Jupyter Notebook 或Spyder、需要matplotlib、numpy、pandas 、sklearn安装包库 3.项目包括3个模块:数据预处理,创建模型并编译,模型训练 4.单模型训练:训练岭回归模型、随机森林模型和极端森林模型。 5. 多模型融合:回归问题最简单的模型融合方式,取加权平均对最优的两个模型进行不同权值的平均,最终输出最优的权值结果。 6. 不同模型的评价指标以rmse为指标,经过分析,融合模型得到最低的rmse,为2.698796237546118。
2023-09-20 06:59:59 10.72MB python 机器学习 算法 回归
1
本文来自于网络,文章详细介绍了使用Python实现机器学习算法的损失函数、反向传播过程等相关知识。在这一章节里,我们将实现一个简单的神经网络架构,将2维的输入向量映射成二进制输出值。我们的神经网络有2个输入神经元,含6个隐藏神经元隐藏层及1个输出神经元。我们将通过层之间的权重矩阵来表示神经网络结构。在下面的例子中,输入层和隐藏层之间的权重矩阵将被表示为W,隐藏层和输出层之间的权重矩阵为W。除了连接神经元的权重向量外,每个隐藏和输出的神经元都会有一个大小为1的偏置量。我们的训练集由m=750个样本组成。因此,我们的矩阵维度如下:训练集维度:X=(750,2)目标维度:Y=(750,1)W维度:(
1