大数据开发实战(Hadoop、Hive、Spark等)
2021-08-03 09:36:55 76.87MB hadoop hive spark mapreduce
1
社交媒体网络在人们的日常生活中发挥着越来越重要的作用。 社区结构是社交媒体网络的显着特征之一,已经被应用到推荐系统和网络营销等实际应用中。 随着社交媒体规模的Swift扩大和信息量的激增,如何在大数据场景中识别社区已成为一个挑战。 基于我们以前的工作和地图方程(来自社区挖掘信息理论的方程),我们开发了一种新颖的分布式社区结构挖掘框架。 在框架中,(1)我们提出了一种新的链接信息更新方法,以试图避免数据写入相关的操作并试图加快该过程。 (2)我们使用来自节点及其邻居的本地信息而不是pagerank来计算节点的概率分布。 (3)我们从先前的工作中排除了网络分区过程,并尝试直接在MapReduce上运行map方程。 在现实世界中的社交媒体网络和人工网络上的经验结果表明,新框架在准确性,速度和可伸缩性方面优于我们以前的工作和一些著名的算法,例如Radetal,FastGN。
2021-07-28 23:12:49 1.6MB Social media, Community structure
1
大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源
2021-07-27 10:12:58 106B
1
基于Maven和Java的MapReduce程序编写
2021-07-26 12:05:11 335KB MapReduce Java
1
大数据分析论文,RDBMS与MapReduce的竞争与共生
2021-07-21 10:36:00 886KB 大数据分析论文 RDBMS MapReduce
1、功能描述 用户的手机,连接到不同的基站会产生一条记录。 数据格式为:用户标识 设备标识 基站位置 通讯的日期 通讯时间 example: 0000009999 0054785806 00000089 2016-02-21 21:55:37 需要得到的数据格式为: 用户标识 时段 基站位置 停留时间 example: 0000000001 09-18 00000003 15 用户0000000001在09-18点这个时间段在基站00000003停留了15分钟
2021-07-21 09:31:27 168KB hive hadoop MapReduce
1
基于MR实现的TFIDF相似度的计算过程,可以深刻理解mapreducer的过程同时了解TFIDF计算过程
2021-07-20 20:30:14 632KB TFIDF 相似度 MR MapReduce
1
此文档用于指导在hadoop完全分布式环境上做mapreduce开发,包括了11个mapreduce实例,讲解详细,适合初步接触mapreduce开发的同学,希望对大家有帮助
2021-07-19 17:06:51 6.86MB hadoop mapreduce
1
MapReduce求取行平均值 MapReduce小实例 数据有经过处理已经添加行号的 也有未添加的 行平均值的四种求法
2021-07-19 13:55:25 3.27MB MapReduce hadoop 平均值 行平均值
1
Community Detection inOnline Social Networks大数据大中小数据集所对应的mapreduce代码
2021-07-17 22:49:46 782B 大数据 mapreduce 社交网
1