内容包括2015至2023年的国内汽车销售数据,包含3张表,涉及年份、月份、车型、售价、厂商、销量、同比增长情况等字段,可以用于数据分析练习使用,可用于数据清洗、相关性分析、回归分析等Python练习
2024-07-01 12:18:54 2.55MB 数据分析 python 数据集
1
资源中包含了诸多关于商品零售信息的资源,可作为数据分析与可视化的数据
2024-06-28 09:40:10 6.55MB 数据集 python 数据分析 数据可视化
1
python模拟高考录取
2024-06-27 19:59:40 4.95MB python 数据处理 学习笔记
1
pandas Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档 所使用第三方库介绍:numpy 、pandas、matplotlib、seaborn、wordcloud、sklearn
2024-06-22 17:54:21 7.77MB python 数据分析 可视化 pandas
1
很不幸的是,由于疫情的关系,原本线下的AWD改成线上CTF了。这就很难受了,毕竟AWD还是要比CTF难一些的,与人斗现在变成了与主办方斗。 虽然无奈归无奈,但是现在还是得打起精神去面对下一场比赛。这个开始也是线下的,决赛地点在南京,后来是由于疫情的关系也成了线上。 当然,比赛内容还是一如既往的得现学,内容是关于大数据的。 由于我们学校之前并没有开设过相关培训,所以也只能自己琢磨了。 好了,废话先不多说了,正文开始。 一.比赛介绍 大数据总体来说分为三个过程。 第一个过程是搭建hadoop环境。 这个开始我也挺懵的,不过后来看了个教程大概懂了。总的来说,hadoop就是一个集成环境,这个环境里
2024-06-21 00:01:17 917KB python 数据分析
1
Python Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
2024-06-18 20:24:07 7.77MB python 数据分析 数据可视化 pandas
1
python数据分析与可视化 项目主要使用boos直聘网数据作为数据源,其中数据文件的主要栏位有职位、城市、公司、薪资、学历、工作经验、行业标签。其中本项目所使用的可计算的栏位为最低薪资、最高薪资、平均薪资、奖金率。 本项目所使用的可分类的栏位为职位、城市、学历、工作经验、行业标签。通过对数据进行清洗重塑和分析,再使用plotly等工具进行绘图,实现图表的交互式数据可视化,最后使用flask框架(利用了bootstrap)进行网页上的可视化展示。最后展示了关于数据分析岗位的人才需求分布情况、薪资情况以及发展前景。
2024-06-17 12:47:10 6.15MB flask python 数据分析
1
python根据小红书关键词爬取所有笔记评论,收集关键词热点,自动化采集数据工具。全源码交付,有教程说明。python爬取小红书搜索关键词下面的所有笔记的评论,情感分析、绘制词云图、词频分析、数据分析。
2024-06-09 21:22:08 2.03MB python 数据爬虫
1
以python作为控制器,在simulink中搭建被控对象模型。技术点涉及python与simulink的数据交互、matlab实时仿真技术、python的数据可视化、增量式PID算法的编写等。有别于平时simulink仿真实验的模型和控制器同处一处,且仿真时间与CPU真实时间不同步。笔者将控制器和被控对象分离,实现远程的实时控制。
2024-06-09 11:08:05 36KB 实时仿真 python数据可视化
1
车流量预测任务是一个回归任务,旨在根据区域历史的车流量情况来预测其未来某一段时间的车流量情况。使用的数据为纽约市出租车流量数据。输入为纽约市各区域的历史车流量时间序列,输出为对应各区域的未来车流量的预测值。 纽约出租车流量数据集,时间跨度为从2015年1月1日到2015年3月1日。数据处理成为网格流量数据,时间间隔设定为30分钟。后20天数据被划定为测试集,其余数据为训练集。数据格式:以训练集为例,其shape=(192010202) 代表有1920个时间段,1020个区域,2个特征分别为区域的入流量与出流量
2024-06-01 21:17:29 1.11MB 深度学习 python 数据集
1