只为小站
首页
域名查询
文件下载
登录
基于python的分布式网络爬虫
使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现, 爬虫状态显示使用graphite实现。这个工程是我对垂直搜索引擎中分布式网络爬虫的探索实现,r, 将其网站的书名,作者,书籍封面图片,书籍概要,原始网址链接,书籍下载信息和书籍爬取到本地:分布式使用redis实现,redis中存储了工程的request,stats信息,能够对各个机器上的爬虫实现集中管理,。
2024-06-28 15:09:25
9.74MB
python
分布式
毕业设计
爬虫
1
Python-电信用户流失预测
项目概况 开发环境:Jupyter Notebook(Anaconda3的应用包下) 项目描述 一、获取数据集并预处理 在网上(例如Kaggle)下载数据集,读入数据并进行数据预处理。 二、根据特征群进行可视化分析 数据总体分成三大特征群,逐一分析各特征群下,每个特征在特征群中的重要程度,在客户流失因素上的重要程度。对数据进行可视化分析,通过饼状图的对比,对各项特征指标有一个直观的清晰的 认识。 三、特征工程与类别平衡 数据预测前一系列处理,先进行特征工程处理,结合皮尔逊相关系数,把无用特征进行剔除,完善字符编码格式。再处理类别不平衡的问题(正负样本数相差较多,易导致数据倾斜或不准确)。 四、模型使用与评估 使用机器学习模型与模型评估方式,用K折交叉验证计算方式,分别对逻辑回归,随机森林,AdaBoost,XGBoost模型进行评估,得出预测模型的准确度,后续选择其中之一进行实际预测,并输出模型中的特征重要性。 五、总结分析与制定决策 总结分析,合并各客户的预测流失率与真实流失率,形成关系表。运营商可以根据分组情况的结果设定阈值并进行决策,从而确定分界点进行客户召回措施。
2024-06-28 13:06:06
10.88MB
Kaggle
1
零基础征服数据结构算法Python版视频教程2023
零基础征服数据结构算法Python版视频教程2023
2024-06-28 11:34:08
200B
数据结构
python
1
手写数字识别python 示例代码
手写数字识别python 在这个示例中,我们使用PyTorch实现了一个基于LeNet5模型的手写数字识别器,并在MNIST数据集上进行了训练和测试。代码中包括数据加载、模型定义、损失函数和优化器的声明,以及训练和测试的代码逻辑。需要注意的是,在实际使用过程中,我们需要根据具体的应用场景选择合适的模型结构、损失函数、优化器等,并对数据进行适当的预处理和后处理。
2024-06-28 11:29:51
3KB
pytorch
pytorch
python
1
商品零售数据集.rar
资源中包含了诸多关于商品零售信息的资源,可作为数据分析与可视化的数据
2024-06-28 09:40:10
6.55MB
数据集
python
数据分析
数据可视化
1
python模拟高考录取
python模拟高考录取
2024-06-27 19:59:40
4.95MB
python
数据处理
学习笔记
1
基于CNN的鸟类识别系统(python)
基于深度学习的鸟类识别系统,可以识别六种鸟类,资源包含训练数据集。
2024-06-27 16:49:20
131.01MB
python
1
实现png图片批量转argb8888
gen_argb8888.py实现将当前目录下所有png图片转为argb8888格式 gen_argb8888_v2.py实现将当前目录下所有png图片和子目录转为argb8888格式
2024-06-27 14:02:30
27KB
python
图片转换
1
第1组训练的最佳权重文件
包括了用于将VOC格式标签转化为yolo格式标签的python脚本,生成训练集、验证集和测试集的python脚本,YOLOv8配置文件,以及训练所有子集的python脚本
2024-06-26 23:43:42
130.4MB
python
1
携程游记爬取+词云分析
携程游记爬取+词云分析
2024-06-26 20:07:08
8.16MB
爬虫
python
词云
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
芯片验证漫游指南以及源代码.zip
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
得到品控手册7.0.pdf
2019和2021年华为单板通用硬件笔试题及答案
中国地面气候资料日值数据集(V3.0)2010-2019.rar
粒子群多无人机协同多任务分配.zip
基于STM32的电子时钟设计
西安问题电缆-工程伦理案例分析.zip
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
基于LSTM模型的股票预测模型_python
EBSD分析软件——Channel5下载安装教程
python爬虫数据可视化分析大作业.zip
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
RentingSystem.rar
最新下载
WinForm窗体程序中使用CefSharp获取加载后的资源、截取request参数、拦截response数据、注入jquery文件和js代码。
《Head First HTML with CSS & XHTML》电子中文版
20套大屏可视化交互动态模板网页前端模板
方正保护卡驱动2.3.2
山东大学软件学院操作系统复习资料
Aspose.Words.dll 19.6(本人亲测可用版本)
小说完整源码(含小程序前端后端源码数据库)
飞跃手册汇总.rar
天天ASMR ——掏耳 哄睡 助眠 音声 白噪音,各种声音治疗你的失眠
npoi (excel导入导出)帮助类
其他资源
基于matlab的交通流
电子闹钟《微机接口与汇编语言》课程设计报告
GB/T 9385-2008计算机软件需求说明编制指南(最新版)
智能车matlab仿真代码更新版
OneToolPlus.7z
细菌觅食优化算法
dmx512协议应用(完整的led舞台灯控制程序)
java设计一个可以根据鼠标的拖曳画直线,矩形,圆的画图程序。
mathematica 使用教程(中文版)
Qt使用QMediaPlayer制作的视频播放器
stm32实现最小二乘工程代码
心电信号_深度学习
AutoPlot.py
海南大学《网络系统集成》复习PPT.pptx
TCPIP协议的FLash讲解动画(共15节)
图片切割工具Matlab实现
opencv 类似matlab 绘图
近程高精度脉冲激光测距系统的研究
Auto.js软件及打包插件合集.zip
wince 6.0安装包下载地址
IPOD_iphone_ipad解密验证芯片2.0B_R5
Java反射demo