大数据技术之hadoop,详细讲解hdfs系统,理解分布式存储
2021-10-08 10:46:29 16.19MB hadoop 大数据 hdfs
1
大数据技术之Ambari
2021-09-25 22:31:49 404KB Presto 大数据
1
基于GPU的Spark大数据技术在实验室的开发应用.pdf
2021-09-25 19:03:44 4.02MB GPU 处理器 数据处理 参考文献
Kafka是一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。在本课程中,你将学习到,Kafka架构原理、安装配置使用、详细的Kafka写入数据和处理数据以及写出数据的流程、新旧版本对比及运用、分区副本机制的详解、内部存储策略、高阶API直接消费数据、等等
2021-09-22 14:54:20 85.76MB kafka
1
城市交通大数据技术及智能应用系统.pdf
2021-09-15 19:04:17 3.06MB 智能系统 人工智能 系统开发 参考文献
信息技术 大数据 GB∕T 35589-2017 信息技术 大数据 技术参考模型
2021-09-15 15:25:41 792KB 大数据 信息技术 参考模型 标准规范
1
大数据技术之ClickHouse
2021-09-09 14:36:48 144KB ClickHouse 大数据
1
针对近年来4G渗透率不断提高所带来的用户质疑流量使用情况的问题,通过深入的研究提出了一种利用移动DPI 的详细话单与计费话单关联的算法,采用大数据平台以及相关处理技术对算法进行了实现,并展示了现网运行评估的效果。
1
Hadoop 技术内幕:深入解析Hadoop Common 和HDFS 架构设计与实现原理 (大数据技术丛书)_高清.pdf
2021-09-06 19:31:39 17.58MB 大数据
1
1、Hadoop 业界资讯......................................... - 1 - 2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究 ........... - 5 - 3、支持自定义爬虫的Nutch segment文件存储接口改写........... - 11 - 4、Nutch中mapreduce应用的几个特殊点 ...................... - 14 - 5、Java RMI + Lucene 构建分布式检索应用初探 ................ - 17 - 6、一对多的表关联在mapreduce中的应用(续) .................. - 26 - 7、InputSplit文件格式分析................................. - 32 - 8、短评:HDFS、MapReduce和HBase三者相辅相成、各有长处 ..... - 34 - 9、HDFS在web开发中的应用................................. - 35 - 10、Mapreduce中value集合的二次排序 ....................... - 38 - 11、Hive SQL手册翻译 ................................... - 47 - 12、Mahout Kmeans简介 .................................... - 57 -
2021-09-06 17:18:56 2.36MB Hadoop HDFS Hive Mahout