大数据技术204.ipynb
2022-09-20 09:05:34 25KB 文档
1
云计算和大数据技术发展现状及趋势探讨.pdf
2022-09-04 16:23:31 2.32MB 大数据 数据分析 数据应用 数据时代
第8部分 (一)大数据技术及应用;主要内容;1.大数据技术的产生 大数据的应用已无处不在 你知道今天头条为什么总能猜对你喜欢的内容?你知道淘宝上的很多客服小姐姐其实都是机器人吗?你知道为什么很多人玩抖音会上瘾?这些软件神奇能力的背后都离不开大数据技术。 ;1.大数据技术的产生 什么是大数据? 大数据是通过获取、存储、分析等方式,从大容量数据中挖掘价值的一种技术架构。;2.大数据有什么特征 大数的4V特性 体量大(Volume):海量数据规模,至少PB级 种类多(variety):数字、文本、图片、视频、音频 速度高(velocity):计算速度快,秒级或毫秒级响应 价值密度低(Value):有用的数据往往隐藏在大量无用数据之中;3.大数据有什么作用 话题讨论 ;1. 数据和信息的关系 相关概念 数据(Date):客观事物的未经加工的原始素材 信息(Information):对数据进行处理和建立内在关联,从而让数据具有意义 知识(Knowledge):从信息中提取出的规律。 智能(Intelligence):将知识去应用于实践,在实践中获得很好的效果。;1. 数据和信息的关系 数据、信息
2022-07-19 12:06:55 3.76MB 计算机 人工智能 大数据
大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.大数据技术与应用.
2022-07-14 19:07:51 5.15MB 大数据技术与应用.
大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用大数据技术与应用
2022-07-14 09:06:55 13.21MB 大数据技术与应用
云计算和大数据技术概念应用与实战-源代码.rar
2022-07-13 11:06:21 10KB 教学资料
02大数据技术与应用专业人才培养方案2020修改版.pdf 学习资料 复习资料 教学资源
2022-07-10 09:06:26 472KB 计算机
课程介绍 Apache Kylin是一个开源的分布式分析引擎,为大数据开发人员提供Hadoop/Spark之上的SQL查询接口,以及支持超大规模数据集的多维分析能力,在大数据领域有着广泛的应用,是大数据开发人员的必备技能之一。 本套视频教程版本升级为4.0,涵盖了Kylin新版的重大功能升级,并将构建引擎和查询引擎全部升级为Spark,将存储由HBase升级为HDFS下的Parquet存储,这三方面的升级大大提升了Kylin的Cube构建效率和查询效率。 教程详细讲解了Kylin 4.0的安装部署过程,与其他框架的版本兼容性也进行了充分调研,并基于真实数据案例进行了实操演示。除此之外,教程中增加了由Kylin官方推荐使用的MDX for Kylin。MDX for Kylin是基于Mondrian二次开发,使用Apache Kylin作为数据源的MDX查询引擎,可以集成多种数据分析工具,提供在大数据分析场景下更极致的体验。教程基于真实数据,提供了详尽的安装、配置和使用讲解。
2022-07-08 18:11:39 75B Kylin hive 分析引擎 大数据
视频详细讲解,需要的小伙伴自行网盘下载,链接见附件,永久有效。 HA(High Available)意为高可用,在本课程中主要是Hadoop的高可用,在实际开发环境中是必不可少的技术之一。你将通过本课程学习到,Hadoop存在的单点故障问题,解决单点故障的方案,搭建手动故障转移的HDFS-HA集群,搭建基于Zookeeper的自动故障转移的HDFS-HA集群以及自动故障转移的Yarn-HA集群。
2022-07-08 18:11:33 75B Hadoop HA 高可用 故障转移
视频详细讲解,需要的小伙伴自行网盘下载,链接见附件,永久有效。 课程介绍 Flink CDC是Flink社区开发的Flink-cdc-connector组件,是一个可以实现从MySQL、PostgreSQL等数据库直接读取全量数据和增量变更数据的source组件。通过使用Flink CDC,搭配Flink的流批一体数据计算引擎,能够实现采集计算一体化,更加方便项目的需求开发和后续维护。 本套视频教程理论与实践相结合,从Flink CDC的基本使用入手,分别讲解了DataStream方式和FlinkSQL方式两种使用模式,并详细讲解了如何自定义反序列化器。更为用户调研了Flink的Flink CDC 2.0,基于1.x的技术痛点,2.0给出了更优化的解决方案,教程结合源码深入分析了其核心原理。
2022-07-08 14:09:28 75B flink cdc 大数据 数据抽取