1、Spark中的HashShufle的有哪些不足 2、 conslidate是如何优化Hash shuffle时在map端产生的小文件 3、spark.def
2022-07-25 17:01:34 10KB spark 大数据
1
1.1 下载并解压 1.2 配置环境变量 1.3 修改配置 1.4 拷贝数据库驱动 1.5 初始化元数据库 1.6 启动 2.2 启动hiveserver2 1
2022-07-25 17:01:31 7KB hadoop 大数据 linux hive
1
通过生存分析,我们希望能够得到研究对象的生存情况在时间上的特点,估计生存率和平均生存时间,进而研究影响生存时间和观察时间发生的保护因素和不利因素。生存分析的特征
2022-07-25 17:01:24 11KB 大数据
1
CDH5集群巡检报告文档
2022-07-25 09:06:09 8.35MB 大数据
1
Hadoop高可用集群搭建
2022-07-24 19:00:32 4.27MB hadoop 大数据
1
使用Scala语言写的一些spark的协同过滤算法,参考使用
2022-07-22 18:05:55 565KB 大数据 协同过滤
1
hadoop技术总结.ppt。 可以作为技术学习、技术交流讲座,拿来即用。
2022-07-21 19:05:38 15.32MB hive、PPT、大数据
1
中文文本分类语料-测试集下载 是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。
2022-07-21 10:16:29 52.72MB 大数据 文本分析 文本训练 机器学习
1
星环科技的产品名为Transwarp Data Hub,它 包含一整套Hadoop组件,星环科技还为Transwarp Data Hub配备 了星环独有的NoSQL搜索引擎、批量分析组件、流处理组件和数据挖 掘组件。Transwarp Data Hub支持Docker和Kubernetes,还提供 独特的PL/SQL编译器。
2022-07-20 21:19:58 2.11MB 大数据 hadoop TDH 星环
1
2017留学行业数据报告,包括人数,专业,出国趋势等各项分析
2022-07-20 17:41:29 3.22MB 数据 报告 留学
1