本实验涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。淘宝购物行为数据集共有5000万条记录,本实验选取的数据集为:第4350万-4500万行,共150万条数据。 首先,实验将本地数据集上传到数据仓库Hive,然后在Hive数据仓库下进行数据分析,接着本实验将数据从Hive导入到MySQL,利用Spark预测回头客行为,最后本实验利用ECharts在eclipse IDE 下进行数据可视化分析,得出了所有买家各消费行为对比、男女买家交易对比、男女买家各个年龄段的交易对比、商品类别交易额对比、各省份的销量对比,这些数据分析结果将有助于淘宝在下一阶段计划制定提供参考。 大学大数据应用,淘宝双11数据;数据分析;Spark;可视化分析,含论文
2021-03-19 16:40:43 4.7MB SPARK 数据分析 大数据应用 林子雨
1
沈阳民政大数据应用建设方案V2,2021智慧民政解决方案民政局监控民政云信息平台民政人脸认证
2021-03-13 22:04:01 4.52MB 智慧民政 智慧民政解决方案
1
顺丰业务介绍、顺丰大数据业务全景图、顺丰IOT大数据应用全景图、顺丰科技大数据技术矩阵、顺丰数据应用架构、数据库实时化、Hudi数仓宽表方案、Flink替换Hive演进等
BDSim:面向大数据应用的组件化高可配并行模拟框架
2021-03-09 14:06:30 1.85MB 研究论文
1
大数据技术应用与案例解析
2021-03-03 21:12:15 12.6MB 大数据 应用 案例
1
详细介绍大数据趋势与发展、大数据处理技术、运营商与大数据、大数据应用场景、华为大数据及数据挖掘解决方案
Online Internet Traffic Monitoring System Using Spark Streaming论文原文
2021-02-17 18:00:07 2.68MB spark 大数据应用
1
大数据导论(通识课版)-第4章-大数据应用(2020年春季学期).ppt
2021-02-04 13:05:57 47.95MB 第4章-大数据应用
区块链与大数据是当前的热门. 区块链如果能在大数据领域得到应用将对无论是区块链还是大数据来说将产生不一样的效果.
2021-01-28 05:10:45 811KB 区块链 大数据 应用 信息技术
1
大数据深度挖掘技术与大数据应用.ppt
2020-01-03 11:40:49 6.52MB 大数据
1