只为小站
首页
域名查询
文件下载
登录
基于python的分布式网络爬虫
使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现, 爬虫状态显示使用graphite实现。这个工程是我对垂直搜索引擎中分布式网络爬虫的探索实现,r, 将其网站的书名,作者,书籍封面图片,书籍概要,原始网址链接,书籍下载信息和书籍爬取到本地:分布式使用redis实现,redis中存储了工程的request,stats信息,能够对各个机器上的爬虫实现集中管理,。
2024-06-28 15:09:25
9.74MB
python
分布式
毕业设计
爬虫
1
Python-电信用户流失预测
项目概况 开发环境:Jupyter Notebook(Anaconda3的应用包下) 项目描述 一、获取数据集并预处理 在网上(例如Kaggle)下载数据集,读入数据并进行数据预处理。 二、根据特征群进行可视化分析 数据总体分成三大特征群,逐一分析各特征群下,每个特征在特征群中的重要程度,在客户流失因素上的重要程度。对数据进行可视化分析,通过饼状图的对比,对各项特征指标有一个直观的清晰的 认识。 三、特征工程与类别平衡 数据预测前一系列处理,先进行特征工程处理,结合皮尔逊相关系数,把无用特征进行剔除,完善字符编码格式。再处理类别不平衡的问题(正负样本数相差较多,易导致数据倾斜或不准确)。 四、模型使用与评估 使用机器学习模型与模型评估方式,用K折交叉验证计算方式,分别对逻辑回归,随机森林,AdaBoost,XGBoost模型进行评估,得出预测模型的准确度,后续选择其中之一进行实际预测,并输出模型中的特征重要性。 五、总结分析与制定决策 总结分析,合并各客户的预测流失率与真实流失率,形成关系表。运营商可以根据分组情况的结果设定阈值并进行决策,从而确定分界点进行客户召回措施。
2024-06-28 13:06:06
10.88MB
Kaggle
1
零基础征服数据结构算法Python版视频教程2023
零基础征服数据结构算法Python版视频教程2023
2024-06-28 11:34:08
200B
数据结构
python
1
OpenCV4系统化学习路线图(新版)
一、什么是OpenCV OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。它由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV提供了大量的计算机视觉、图像处理和模式识别的算法,包括实时图像处理、视频分析、特征检测、目标跟踪、人脸识别、物体识别、图像分割、光流法、立体视觉、运动估计、机器学习和深度学习等。 OpenCV是一个跨平台的库,支持多种操作系统,包括Linux、Windows、Android、Mac OS和iOS等。它使用C++编写,同时也提供了Python、Java、MATLAB等语言的接口,方便不同编程语言的开发者使用。由于OpenCV的开源性和跨平台性,它已经成为计算机视觉领域最受欢迎的库之一,广泛应用于工业检测、医学影像处理、智能交通系统、安防监控系统、机器人视觉、游戏开发等领域。
2024-06-28 11:33:20
3KB
计算机视觉
机器学习
opencv
图像处理
1
手写数字识别python 示例代码
手写数字识别python 在这个示例中,我们使用PyTorch实现了一个基于LeNet5模型的手写数字识别器,并在MNIST数据集上进行了训练和测试。代码中包括数据加载、模型定义、损失函数和优化器的声明,以及训练和测试的代码逻辑。需要注意的是,在实际使用过程中,我们需要根据具体的应用场景选择合适的模型结构、损失函数、优化器等,并对数据进行适当的预处理和后处理。
2024-06-28 11:29:51
3KB
pytorch
pytorch
python
1
商品零售数据集.rar
资源中包含了诸多关于商品零售信息的资源,可作为数据分析与可视化的数据
2024-06-28 09:40:10
6.55MB
数据集
python
数据分析
数据可视化
1
python模拟高考录取
python模拟高考录取
2024-06-27 19:59:40
4.95MB
python
数据处理
学习笔记
1
基于CNN的鸟类识别系统(python)
基于深度学习的鸟类识别系统,可以识别六种鸟类,资源包含训练数据集。
2024-06-27 16:49:20
131.01MB
python
1
实现png图片批量转argb8888
gen_argb8888.py实现将当前目录下所有png图片转为argb8888格式 gen_argb8888_v2.py实现将当前目录下所有png图片和子目录转为argb8888格式
2024-06-27 14:02:30
27KB
python
图片转换
1
第1组训练的最佳权重文件
包括了用于将VOC格式标签转化为yolo格式标签的python脚本,生成训练集、验证集和测试集的python脚本,YOLOv8配置文件,以及训练所有子集的python脚本
2024-06-26 23:43:42
130.4MB
python
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
计算机专业实习日记+实习周记+实习总结
RentingSystem.rar
东南大学英语技术写作慕课所有答案
Python+OpenCV实现行人检测(含配置说明)
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
EEMD算法应用于信号去噪.rar
房价预测的BP神经网络实现_python代码
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
云视通扫描工具.zip
Vivado license 永久
大学生网页设计大作业-5个网页设计制作作品自己任选
最新下载
5.诗词飞花令数据模型及脚本(20221114更新).zip.zip
2022全国大学生数学建模竞赛A题一等奖代码
M9005DN维修手册--中文版
小米、华为、iPhone三款钱包的竞品分析.pdf
运营人常备的营销模型模板(附模板详细twbx文件)
Unity 动态绘制表格 表格分页
目标检测标注,路面积水检测数据
全国_广联达斑马进度计划软件2022免费版_6.0.0.64_(1641366957295)
EZ-Ticket:申请订购足球票
步进电机S型曲线控制代码
其他资源
利用Hash技术统计C源程序中关键字的频度
ICEM Tutorials 15.0
直线一级倒立摆的滑模变结构控制程序
JAVA语言考试系统的设计与实现(论文+源代码+文献综述+外文翻译+开题报告)
富文本编辑器tinymce支持从word复制粘贴保留格式和图片的插件powerpaste源码
Frangi最初提出的Hessian矩阵血管增强,支持2D和3D数据,可直接运行
基于android图书管理系统
WinForm完整项目——“信息管理系统”
复旦大学《电动力学导论》讲稿
whmj.cocos2d_client:威海麻将-源码
direct3D截图
ThroughTheHoloLensLookingGlass.pdf
OPCLink8
[WPF专业编程指南].李应保.高清扫描版 带源码
sharding-jdbc-demo.zip
纹理图像分割算法
Stochastic Process
商品库存管理系统(源码+数据库+论文)
淘宝jsp项目源代码和页面
mysql源代码