大数据是一项不断发展的技术,其通用数据急剧增加,能够处理和存储大量和多样的信息,分别为科学和商业领域的客户和实验提供了丰富的知识。 云计算提供了诸如可用性和可伸缩性,可靠性,容错性以及合并大数据的环境等功能。 尽管大数据解决了当前的许多问题,但仍然存在很多问题,或者我们可以说存在一些差距,这些差距引起了人们的担忧,需要加以完善。 数据异构性,安全性,灾难恢复机制,可伸缩性,隐私,数据治理策略和其他挑战尚待解决。 本文描述了大数据的定义,特征和分类,并通过云计算环境和可用于其安全性的技术对其进行了分析。 进一步描述了两种技术之间的关系。
2022-12-14 23:15:17 622KB 论文研究
1
大数据期末课设~基于spark的气象数据处理与分析 完整版Word 可以拿来直接交作业
1
微软的ASG(应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的dataaudit服务来保证这样量级的数据完整性和实时性非常具有挑战性。本文将介绍微软ASG大数据团队如何利用Kafka、Spark以及Elasticsearch来解决这个问题。微软的ASG(应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的dataaudit服务来保证这样量级的数据
1
基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spark的视频观看数据分析系统项目源码.zip基于Spar
使用三种具有代表性的聚类分析算法对鸢尾花数据集进行聚类分析,分别为层次方法、DBSCAN 方法与K-means 方法。接着使用三个评价指标对聚类的结果进行评价,分别为准确度、运行时间、轮廓系数。本程序包含python程序、实验报告与鸢尾花数据集文件。是本人亲手写的作业且获得高分。层次方法在此数据集上准确度最佳,DBSCAN 方法运行时间最短,层次与 K-means 方法都取得了较高的轮廓系数值。亲手资源,保证一手!
1
作业要求:对给出的网络作社区发现,用至少两种算法进行实现,比较他们的结果并做简单 分析。本文分别使用了scan算法、CPM 算法、slpa算法三种。对每一种算法的流程、结果都有详细的分析报告。文件中包含代码、实验报告(实验报告看作业1部分即可)一应俱全。亲手资源,保证一手!
2022-12-13 14:25:30 14KB 社区发现 scan算法 大数据分析 CPM
1
大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip大数据技术课程的Spark大作业以及Spark实验.zip
2022-12-13 14:24:29 1.02MB 大数据技术课程 Spark大作业 Spark实验
基于机器学习的疫情大数据智能分析和可视化系统源码+项目文档.zip方案实现 数据采集: 本实验数据包含北京, 香港, 上海, 四川, 河北, 甘肃, 陕西, 辽宁, 广东, 台湾, 福建,重 庆, 浙江, 江苏, 天津, 云南, 澳门, 湖北等 34 个省份城市(含港澳台)的疫情数据,其中数据 字段包括: 读取数据 数据预处理 缺失值处理 日期转换 连续数值转换 离散数值转换 特征工程 建立模型 模型训练 模型评估 模型优化 模型实施 中国高校计算机大赛-网络技术挑战赛选拔赛阶段作品设计文档 id:数据编号 confirmedCount:累计确诊 confirmedIncr:新增确诊 curedCount:累计治愈 curedIncr:新增治愈 currentConfirmedCount:现存确诊 currentConfirmedIncr:新增现存确诊 dateid:日期 deadCount:累计死亡 deadIncr:新增死亡 suspectedCount:累计疑似 suspectedCountIncr:新增疑似 数据预处理: 1、统计数据行列数,查看部分数据,如图 1: df.sh
基于Hadoop的商品推荐系统源码+数据库文件+使用教程.zip已获导师指导并通过的高分项目 安装教程 创建数据库并导入sql脚本 运行com.cy.store.StoreApplication 主程序 打开浏览器 localhost:8081 访问 大数据运行: 解压 hadoop推荐算法 zip 搭建Hadoop然后运行,数据已经分析导入mysql,不再赘述 软件架构 大数据架构: 基于物品的协同过滤算法主要有两步: 1、计算物品之间的相似度:可依据物品共现次数、余弦夹角、欧氏距离这三种方法计算得到物品之间的相似度。 2、根据物品的相似度和用户的历史购买记录给用户生成推荐列表 最终推荐的是什么物品,是由推荐度决定的。 核心:找出所有两两同时被购买商品出现的次数, 现在其中有用户购买了其中一个商品,推荐该商品组合另外一件商品 后端架构: springboot + mybatis 框架 前端架构: HTML Ajax 基于Hadoop的商品推荐系统源码+数据库文件+使用教程.zip基于Hadoop的商品推荐系统源码+数据库文件+使用教程.zip基于Hadoop的商品推荐系统源码+数据库
基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库.zip基于Hadoop图书推荐系统源码+数据库