搜索【hadoop spark】的结果

Spark中动态分区算法的设计与实现，阎逸飞，王智立，Spark是一种被广泛使用的分布式计算框架。在分布式环境中，一个重要且常见的问题是数据倾斜。为解决Spark shuffle过程中中间数据倾斜导

2023-03-06 18:25:19 480KB 计算机系统结构

随着Internet技术的迅速发展，网络舆情监控系统正在得到广泛应用。网络舆情监控系统的数据量也急速膨胀，如何高效地存储和管理这些海量的非结构或半结构化数据成为网络舆情系统研发中的挑战课题。传统的关系数据库和分布式计算等数据处理的方式也越来越不能适应日益增长网络大数据。针对微博数据的特点建立了一种面向微博舆情应用的Hadoop存储平台的多层体系架构，并采用列数据库设计多种微博结构化数据的表结构，以及表之间的关系模型。测试结果表明，设计的存储管理平台具有检索响应速度快、可扩展性好等特点。

2023-03-06 13:41:00 504KB 舆情分析

大数据需要的安装包有apache-maven、repository.tar.gz等

内有安装包 apache-maven-3.6.1-bin.tar.gz eclipse-jee-kepler-SR1-linux-gtk-x86_64.tar.gz hadoop-2.7.7.tar.gz jdk-8u271-linux-x64.tar.gz repository.tar.gz

2023-03-03 15:55:58 696.11MB hadoop eclipse maven jdk

HDP3.1.5自定义服务Kylin4.0.1 spark3.1.1的statck包

2023-03-02 13:00:51 1.49MB ambari kylin spark

基于分布式的大屏可视化智联招聘数据分析与预测

互联网成了海量信息的载体，目前是分析市场趋势、监视竞争对手或者获取销售线索的最佳场所，数据采集以及分析能力已成为驱动业务决策的关键技能。《计算机行业岗位招聘数据分析》旨在利用python编写爬虫程序，从招聘网站上爬取数据，将数据存入到Mysql数据库中，将存入的数据作一定的数据清洗后做数据分析，最后将分析的结果做数据可视化。爬取招聘网站（智联招聘）上的计算机行业数据，字段为公司招聘链接,公司名称,公司规模,公司性质，职位领域，职位名称，学历要求，职位类别，职位亮点（福利），工资水平，城市，工作经验，简历统计，公司打分，工作地址，职位要求，人员需求，公司业务范围，进行数据清洗及数据维度分析进行数据可视化。此项目完成之后将大大节约我们查找招聘岗位的时间，它的重大意义是让我们查看工作岗位信息数据进行了数据化、规范化、自动化、可视化管理。它可以帮助我们了解行业的薪资分布、城市岗位分布、岗位要求关键字、岗位经验要求等等一系列的数据。

2023-03-01 11:36:23 3.43MB 分布式 hadoop spark Python爬虫

Hadoop hbase hive sqoop集群环境安装配置及使用文档

2023-03-01 11:02:31 133KB 大数据集群 hadoop hbase hive

基于云平台Hadoop的中医数据挖掘系统设计与实现.pdf

2023-02-28 21:58:34 1.63MB

web前端使用纯HTML，不使用CSS，利用的table布局hadoop

1、创建一个文本文件main.html，用记事本打开 2、使用table完成布局和表格部分设计，网页宽度设计为1170px； 3、复制文本，使用等标记定义文本格式 4、复制网页链接地址 5、复制网页图片 hadoop.apache.org/releases.html

2023-02-28 18:47:49 36KB 前端 html

1

大数据Spark企业级实战版

大数据Spark企业级实战版带书签

2023-02-26 23:43:23 111.09MB Spark

1

hadoop 64位本地库 native 2.9.2

xxxx: Java HotSpot(TM) 64-Bit Server VM warning: You have loaded library /usr/local/hadoop-2.4.0/lib/native/libhadoop.so which might have disabled stack guard. The VM will try to fix the stack guard now. xxxx: It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.

2023-02-25 00:09:42 2.41MB hadoop native

1

个人信息

点我去登录

下载历史

热门下载

PSO-LSSVM的MATLAB代码.rar

quartus II13.0器件库.zip

麻雀搜索算法（SSA）优化bp网络

copula程序及算法.zip

ChinaMeteorologicalDataHandler.R

Matpower中文使用手册（原名《MATPOWER手册（中文版）》）.rar

基于FPGA的DDS信号发生器设计（频率、幅度、波形可调）

新型冠状病毒疫情_2020年东三省数学建模A题_论文展示

C4.5决策树算法的Python代码和数据样本

BP神经网络+PID控制simulink仿真

数字信号处理——保研复习资料.pdf

sqlite运行所需Vc++运行环境，纯净版System.Data.SQLite.dll及SQLite.Interop.dll

通过svm cnn knn对高光谱数据集PaviaU进行分类（matlab）

Keil5安装包

PLECS中文手册.pdf

最新下载

simulink实现他励直流电动机直接启动仿真

飘逸传世引擎源代码

《Java设计模式》课程设计报告.docx

彩虹一代引擎加注册机没有时间限制的那种

Legged robot that balance

科远NT6000虚拟控制器软件

高等天线理论第六章天线基础理论本人手写笔记

R语言在数据分析与建模中的应用案例

vos3000 2.1.7.03

ISO/IEC13818-1，13818-2，13818-3，13818-4，13818-7，及MPEG2标准中文版

其他资源

编译原理实验中间代码优化代码报告

将8位图片转换为coe文件

机械设计计算齿轮强度校核M文件

五次谐波仿真Multisim

IE7绿色版 for win7

数值分析（武汉大学课件ppt）绝对好用

ANSYS 15.0 Fluent Theory Guide

进程调度的设计与实现图形界面实现源代码 vc

SQLyog13.1.1.rar

【2020.5.1中英文停用词整理优化】STOP.txt

ORL人脸库的PCA人脸识别，GUI界面

nRF52832开发指南-上册.pdf

信息学奥赛一本通-教程PPT课件（第五版）第3章选择结构(C++版).ppt

面部识别脑-源码

从零开始的神经网络：对神经网络进行编码-源码

stm32的IAP与APP相互转换程序

git-sdk-installer-1.0.6-32.7z.exe

全志平台硬编硬解附带资料

Total Audio Mp3 Converter v3.2.3 Build 1415+key

Android_Build_Environment_on_Ubuntu_14.04_64-bit_Installation_SOP_6253959040

模仿钉钉选择每个步骤的审核人的html代码

最新Ace-Admin 完全兼容IE8 以下

铁路轨道高低平顺性指标计算程序代码

共 1000 条上一页 1 … 13 14 15 16 17 … 100 下一页共 1000 条