解决 java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArray(II[BI[BIILjava/lang/String;JZ)V
2023-03-27 12:37:53 83KB hadoop
1
运营商关于用户基站停留数据统计 一.功能需求概述 (1)数据源:pos.txt,上传到hdfs,保存的目录以个人学号区分 (2)程序运行支持传入时间段,比如“09-18-24”,表示分为0点到9点,9点到18点,18点到24点三个时间段。 (3)统计每个用户在不同时段中各个基站的停留时间
2023-03-23 14:44:28 1.22MB hadoop
1
Hadoop in action(中文版)
2023-03-22 09:34:37 2.7MB Hadoop in action
1
<数据算法--Hadoop-Spark大数据处理技巧>.pdf全书686页,英文比中文容易理解 本资料共包含以下附件: 724f58d66ab6b3c4c6412e91117878cb.zip
2023-03-20 11:11:06 36.93MB 大数据 spark
1
spark-assembly-1.3.0-hadoop2.5.0-cdh5.3.0.jar的下载地址和提取码
2023-03-16 15:35:01 45B spark-sql hadoop spark-yarn
1
HDFS,HBase,Hive,Zookeep,Yarn,HadoopLoader,Storm,Kafka,Spark等命令实例,系统全面。
2023-03-14 18:10:26 168KB hadoop 大数据 nosql
1
基于Hadoop高性能查询的空间数据库设计与实现(毕业论文)
2023-03-12 19:42:08 377KB 毕业论文 Hadoop 数据库
1
随着Internet技术的迅速发展,网络舆情监控系统正在得到广泛应用。网络舆情监控系统的数据量也急速膨胀,如何高效地存储和管理这些海量的非结构或半结构化数据成为网络舆情系统研发中的挑战课题。传统的关系数据库和分布式计算等数据处理的方式也越来越不能适应日益增长网络大数据。针对微博数据的特点建立了一种面向微博舆情应用的Hadoop存储平台的多层体系架构,并采用列数据库设计多种微博结构化数据的表结构,以及表之间的关系模型。测试结果表明,设计的存储管理平台具有检索响应速度快、可扩展性好等特点。
2023-03-06 13:41:00 504KB 舆情分析
1
内有安装包 apache-maven-3.6.1-bin.tar.gz eclipse-jee-kepler-SR1-linux-gtk-x86_64.tar.gz hadoop-2.7.7.tar.gz jdk-8u271-linux-x64.tar.gz repository.tar.gz
2023-03-03 15:55:58 696.11MB hadoop eclipse maven jdk
1
互联网成了海量信息的载体,目前是分析市场趋势、监视竞争对手或者获取销售线索的最佳场所,数据采集以及分析能力已成为驱动业务决策的关键技能。《计算机行业岗位招聘数据分析》旨在利用python编写爬虫程序,从招聘网站上爬取数据,将数据存入到Mysql数据库中,将存入的数据作一定的数据清洗后做数据分析,最后将分析的结果做数据可视化。 爬取招聘网站(智联招聘)上的计算机行业数据,字段为公司招聘链接,公司名称,公司规模,公司性质,职位领域,职位名称,学历要求,职位类别,职位亮点(福利),工资水平,城市,工作经验,简历统计,公司打分,工作地址,职位要求,人员需求,公司业务范围,进行数据清洗及数据维度分析进行数据可视化。 此项目完成之后将大大节约我们查找招聘岗位的时间,它的重大意义是让我们查看工作岗位信息数据进行了数据化、规范化、自动化、可视化管理。它可以帮助我们了解行业的薪资分布、城市岗位分布、岗位要求关键字、岗位经验要求等等一系列的数据。
2023-03-01 11:36:23 3.43MB 分布式 hadoop spark Python爬虫
1