Hive是一个数据仓库;3.1.2版本,可用于集群安装;Hive是一个数据仓库,它部署在Hadoop集群上,它的数据是存储在HDFS上的,Hive所建的表在HDFS上对应的是一个文件夹,表的内容对应的是一个文件。它不仅可以存储大量的数据而且可以对存储的数据进行分析,但它有个缺点就是不能实时的更新数据,无法直接修改和删除数据,如果想要修改数据需要先把数据所在的文件下载下来,修改完之后再上传上去。Hive的语法非常类似于我们的MySQL语句,所以上起手来特别容易。HIve特别神奇的地方是我们只需写一条SQL语句它就会自动转换为MapReduce任务去执行,不用我们再手动去写MapReduce了
2021-12-18 21:13:41 53B Hive安装包 linux hive
1
关于Criteo数据的FFM 尝试使用以下现场感知分解机(FFM)的实施方式来复制的结果: 数据 下载完整的数据集并将其转换为CSV格式: ./data.sh ln -s train.csv tr.csv ln -s test.csv te.csv 或者,使用微小的数据: ln -s train.tiny.csv tr.csv ln -s test.tiny.csv te.csv 用法 建立LIBFFM并预处理数据,就像: make 移至或并按照说明进行操作。 参考
2021-12-18 15:10:28 370KB hive kaggle factorization-machines ctr-prediction
1
Spark权威指南:hadoop从入门到精通课程,hadoop是大数据的基本,包括mapreduce,hdfs
2021-12-17 13:21:39 910KB Hadoop
1
hive的12道sql.sql
2021-12-17 11:04:08 42KB hql
1
应用spark2.1的api对hive对进行读写,代码中有明确的操作步骤。
2021-12-17 01:40:38 13KB spark,hive
1
hive+mysql安装详细步骤
2021-12-16 09:08:25 52KB hive mysql
1
NULL 博文链接:https://kf47453.iteye.com/blog/2273912
2021-12-15 16:54:07 2.31MB 源码 工具
1
大数据练手项目——Youtube数据源
2021-12-15 16:33:02 120.9MB hadoop hive youtube data
1
DataX是一个支持主流数据库的通用数据采集工具 详细描述了如何安装部署和每个采集插件的使用方法 该项目从阿里的而来,经过了精简和改造,说明如下 功能差异说明 精简 删除了仅在阿里内部的数据库,这些数据库在非阿里集团无法使用,因此直接删除,包括: 美国存托凭证 DRDS OCS ODPS 开源软件 OTS 增加 增加了部分插件,目前包括 阅读器插件 clickhousereader dbffilereader hbase20xreader jsonfilereader Kudureader influxdbreader httpreader 作家插件 dbffilewrite 青梅作家 库杜作家 Influxdbwriter 部分插件增强功能,罗列如下 关系型数据库增加了几乎所有基本数据类型和部分复杂类型的支持 hdfswriter增加了对十进制数据类型格式的支持 hdfswriter增加了对Parquet文件格式的支持 hdfswrite增加了目录覆盖模式 hdfswriter增加了更多的文件压缩格式支持 hdfswriter的临时目录位置放入为当前写入目录下的
2021-12-15 14:35:54 2.12MB mysql java database influxdb
1
Hive学习基础资料,基本操作命令,创建表格,HIve命令行
2021-12-14 20:21:56 2.34MB hive
1