本项目实现对给定的移动设备数据集分析。预测使用者性别年龄。 1、统计最多使用的手机品牌以及最受欢迎型号。 2、统计 app 最活跃日期及当前使用量。 3、统计 app 最活跃时间段及每个时间段使用情况。 4、分析 app 最活跃地区及该地区范围使用量情况。 5、将使用量最高的 app 统计显示其类别。 6、建立性别年龄预测模型并检验其准确率。 该实验用 python 编写在 pycharm 平台编译,运行于 x86/64Windows 平台。 内含项目完整代码配套报告以及演示视频。
2022-10-11 22:13:02 469.25MB python 可视化
该资源是针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉加油、湖北加油、全国加油。待到疫情结束樱花盛开,这座英雄的城市等你们来。 基础性资源,希望对您有所帮助。 详见内容:https://blog.csdn.net/Eastmount/article/details/105462139 该资源是针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉加油、湖北加油、全国加油。待到疫情结束樱花盛开,这座英雄的城市等你们来。 基础性资源,希望对您有所帮助。 详见内容:https://blog.csdn.net/Eastmount/article/details/105462139
2022-07-13 15:51:42 36.37MB 数据分析 知识图谱 疫情分析 Python
1
大数据分析与可视化——全球空气质量研究报告:由全球到中国再到天津,根据数据进行可视化并展开分析。全文共21页,word + 图文,仅供学习参考。可视化工具为tableau
该资源是针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉加油、湖北加油、全国加油。待到疫情结束樱花盛开,这座英雄的城市等你们来。 基础性资源,希望对您有所帮助。 详见内容:https://blog.csdn.net/Eastmount/article/details/105462139
2021-06-21 22:09:41 33.36MB 数据分析 知识图谱 疫情分析 Python
1
数据来自墨西哥的国家,秘鲁和哥伦比亚,年龄在14至61和不同的饮食习惯和身体状况,有17属性和信息处理2111条记录。与饮食习惯相关的属性有:频繁摄入高热量食物(FAVC)、蔬菜摄入频率(FCVC)、主餐次数(NCP)、餐间食物摄入(CAEC)、每日用水量(CH20)、饮酒量(CALC)。与身体状况相关的属性为:卡路里消耗监测(SCC)、体育活动频率(FAF)、使用科技设备时间(TUE)、使用交通工具(MTRANS),获得的其他变量为:性别、年龄、身高和体重。标签变量为NObesity,其值为:不足体重、正常体重、超重I级、超重II级、肥胖I级、肥胖II级和肥胖III级。 该数据集为UCL开源数据集,无需授权即可使用。 主要适用Pandas库进行数据分析,是使用Python进行大数据分析入门的很好示例教材。
2021-06-21 14:02:15 1.07MB Pandas Python 大数据分析 数据可视化
该资源是针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉加油、湖北加油、全国加油。待到疫情结束樱花盛开,这座英雄的城市等你们来。 基础性资源,希望对您有所帮助。 详见内容: [Pyhon疫情大数据分析] 三.新闻信息抓取及词云可视化、文本聚类和LDA主题模型文本挖掘 https://blog.csdn.net/Eastmount/article/details/104698926 [Pyhon疫情大数据分析] 二.PyEcharts绘制全国各地区、某省各城市疫情地图及可视化分析 https://blog.csdn.net/Eastmount/article/details/104437215 [Pyhon疫情大数据分析] 一.腾讯实时数据爬取、Matplotlib和Seaborn可视化分析全国各地区、某省各城市、新增趋势 https://blog.csdn.net/Eastmount/article/details/104298388 --------------------------------------------------------------- By:Eastmount CSDN
2021-04-12 17:20:40 5.08MB Python 大数据分析 文本挖掘 可视化分析
1
每天都有着大量的用户关注各类新闻,特别是随着各种网络通信技术的发展,网络应用的普及使得每时每刻都有着大量的人们通过网络进行各类新闻的搜索,产生海量的日志数据。过去使用单机的方式通过 MySQL数据库对这些数据进行存储,但是积累下来的用户日志数据量达到了一定的级别,当一台电脑无法存储这么庞大的数据时,就产生了海量数据的存储问题。如果使用网络文件系统对数据进行分开存储,那么就无法对大量的实时和离线数据进行分析处理,处理结果也无法以一种更加直观的方式进行展示。 为了解决海量新闻日志数据的存储问题,在新闻业务中得到实时的用户搜索内容的排行并进行可视化显示,得到公众关注的重点,从而达到针对用户关注的重点进行推送、广告的投放、及时消除不良的用户等目的。本文在对以上需求进行调研后,通过Flume日志收集系统对各个服务器中的日志文件进行读取合并,并将数据划分成离线流数据和实时流数据两条路线。离线数据通过Hadoop集群处理、存储,通过Hive完成离线数据处理和分析,并最终通过Hue实现对用户的可视化展示。实时流数据通过Kafka消息队列临时存储,并通过Spark流处理,最终将结果存放在 MySQL数据库中,通过Java程序获取,最终通过Echarts插件在前端对实时数据进行展示。 本文讲述了系统研究的背景、目的和意义。对系统所使用到的相关技术的原理进行了介绍;对系统进行了总体的需求分析并且按照系统实现的功能划分了相关模块;在进行了需求分析后,对系统进行了具体的硬件平台构建以及各个功能模块设计实现,最终完成对用户搜索日志数据的结构化处理和可视化展示。 最后对课题工作进行了总结,并分析了未来系统中可改进的地方。
1
安居客网址结合大数据分析房价可视化分析,分别利用python爬虫爬取安居客的某个省的各个地区的二手房房价的最大、最少、平均、中位数、进行可视化分析展示。
2021-02-25 15:50:24 3.09MB python 大数据 爬虫
1