搜索【详解Hadoop核心架构HDFS MapReduce Hbase Hive】的结果

hadoop-python-mapreduce:有关如何使用Python运行Hadoop MapReduce的教程

Hadoop和Python的Mapreduce 关于如何使用Python和Hadoop执行MapReduce的一小段回购。映射器和化简器都是用Python编写的。有关如何在Hadoop中实现这两个脚本的教程位于。

2023-02-22 17:06:20 1021KB Python

1

hbase_py3.zip

无奈没有积分，逐个问题修复，免费给大家，喜欢的点个赞，python3读取Hbase通过Thrift操作时用到hbase-thrift包，但是运行时报错IOError，ttypes，xrange，iteritems等错误。

2023-02-19 10:32:40 64KB python3 hbase IOError Xrange

1

HBase权威指南中文版.pdf

带有详细目录的 HBase权威指南中文版.pdf

2023-02-10 18:23:03 43.03MB Hbase

1

HIVE从入门到精通.pdf

Hive从入门到精通，适合想学hive的小白看

2023-02-05 12:30:39 1.18MB Hive入门 Hive

1

flink-kafka-hbase:功能：实现kafka消息实时落地hbase，支持csvjson字符串两种格式的消息，支持自定义组合rowkey,列簇和列名，支持按照kafka消息流中不同字段join不同的hbase表，并自定义写入列簇和列(join时需评估一下性能)，支持at least once语义外部依赖：apollo配置中心，本项目依靠配置驱动，配置存储在apollo配置中心

flink-kafka-hbase 功能：实现kafka消息实时落地hbase，支持csv/json字符串两种格式的消息，支持自定义组合rowkey,列簇和列名，支持按照kafka消息流中不同字段join不同的hbase表，并自定义写入列簇和列(join时需评估一下性能) 支持at least once语义外部依赖：apollo配置中心，本项目依靠配置驱动，配置存储在apollo配置中心配置： { "indexColumnMapping": { --indexColumnMapping即CSV格式消息的key和value按照value里的分隔符拼接后再分割后下标及写入hbase列的对应关系 "0": "basic:time", --第0列始终是kafka消息的key，如果不需要可以不指定 "1": "basic:user_id",

2023-01-30 14:24:41 35KB kafka apollo hbase flink

1

hive-jdbc-uber-2.6.5.0-292.jar驱动

2023-01-05 14:18:57 15.79MB dbeaver hive

1

Sqoop通过Phoenix导hbase数据到hive

出现此问题时使用：java.lang.NullPointerException at org.json.JSONObject.(JSONObject.java:144) at org.apache.sqoop.util.SqoopJsonUtil.getJsonStringforMap(SqoopJsonUtil.java:43) at org.apache.sqoop.SqoopOptions.writeProperties(SqoopOptions.java:784) at org.apache.sqoop.mapreduce.JobBase.putSqoopOptionsToConfiguration(JobBase.java:392) at org.apache.sqoop.mapreduce.JobBase.createJob(JobBase.java:378) at org.apache.sqoop.mapreduce.ImportJobBase.runImport(ImportJobBase.java:256) at org.apache.sqoop.manager.SqlManager.importQuery(SqlManager.java:748) at org.apache.sqoop.tool.ImportTool.importTable(ImportTool.java:515) at org.apache.sqoop.tool.ImportTool.run(ImportTool.java:621) at org.apache.sqoop.Sqoop.run(Sqoop.java:147) at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) at org.apache.sqoop.Sqoop.runSqoop(Sqoop.java:183) at org.apache.sqoop.Sqoop.runTool(Sqoop.java:234) at org.apache.sqoop.Sqoop.runTool(Sqoop.java:243) at org.apache.sqoop.Sqoop.main(Sqoop.java:252)

2023-01-05 11:51:26 80KB hbase

1

基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip

基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目，下载即用，无需修改。基于hadoop平台hive数据库的taptap游戏平

2023-01-04 18:23:30 15.57MB taptap游戏平台大数据分析 hive数据库的游戏数据分析 基于hadoop的游戏数据分析项 大数据

基于Hadoop的hive数据库的网站流量日志数据分析系统项目源码（毕业设计）.zip

基于Hadoop的hive数据库的网站流量日志数据分析系统项目源码.zip 已获导师指导并通过的高分项目。下载即用，内附说明。项目背景 1、项目名 “网站流量日志数据分析系统” 2、概念 a、点击流点击流（Click Stream）是指用户在网站上持续访问的轨迹，形成点击事件，它会记录用户浏览站点的整个过程。 image-20211123085322048 二、日志数据的数据格式 image-20211123090020444 页面点击流数据 image-20211123091013446 点击流模型Visits表 image-20211123091120698 三、骨灰级指标 1、IP 1天之内，不重复的ip数，统计ip数 2、PV 页面加载的总次数 3、UV 1天之内，访问网站的不重复用户数（以浏览器cookie为依据），一天内同一访客多次访问网站只被计算1次。四、整体技术架构流程 1、数据采集 2、数据预处理 3、数据入库 4、数据分析 5、数据展示 image-20211201143716799 image-20211123114258257 五、技术分析

2023-01-04 18:23:28 9.62MB hive数据库的网站数据分析系统 基于Hadoop的网站数据分析系 网站流量日志数据分析系统 大数据

Hadoop中MapReduce基本案例及代码（三）

分区Partitioner 分区操作是shuffle操作中的一个重要过程，作用就是将map的结果按照规则分发到不同reduce中进行处理，从而按照分区得到多个输出结果。 Partitioner是partitioner的基类，如果需要定制partitioner也需要继承该类HashPartitioner是mapreduce的默认partitioner。计算方法是：which reducer=(key.hashCode() & Integer.MAX_VALUE) % numReduceTasks 注：默认情况下，reduceTask数量为1 很多时候MR自带的分区规则并不能满足我们需求，为了实

2023-01-03 20:20:54 101KB c ce do

1

个人信息

热门下载

最新下载

其他资源