在搭建完hadoop大数据系统(CDH5.16.1)后,如何访问hdfs文件系统上的数据呢?那当然是通过构建maven项目 使用java api接口进行文件了。为此,特别进行了hdfs文件系统java api访问的整理。
2023-06-19 17:24:42 13KB HDFS HADOOP JAVA API
1
基于java讲解了mahout的主要的三种算法,聚类,分类,相似度,非常适合初学者的学习
2023-06-07 16:00:35 23KB 机器学习 mahout 大数据 协同过滤
1
互联网的飞速发展促进了很多新媒体的发展,不论是知名的大V,明星还是围观群众都可以通过手机在微博,朋友圈或者点评网站上发表状态,分享自己的所见所想,使得“人人都有了麦克风”。不论是热点新闻还是娱乐八卦,传播速度远超我们的想象。可以在短短数分钟内,有数万计转发,数百万的阅读。如此海量的信息可以得到爆炸式的传播,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。大数据时代,除了媒体信息以外,商品在各类电商平台的订单量,用户的购买评论也都对后续的消费者产生很大的影响。商家的产品设计者需要汇总统计和分析各类平台的数据做为依据,决定后续的产品发展,公司的公关和市场部门也需要根据舆情作出相
1
DAMA数据管理知识体系管理指南高清、学习笔记、试题、思维导图 适用于想学习数据管理,并考DAMA、CDGP、CDGA考试的人群
2023-06-01 23:32:29 343.55MB DAMA 大数据
1
在使用easyui datagrid途中发现加载数据的效率真的不是一般的差。经测试IE8加载300条数据就感觉明显的慢了,加载2000条数据就另人崩溃用时差不多60秒,就算在google浏览器测试结果也快不了几秒。 平时听闻easyui datagrid效率底下,自己测试才发现真是使人无法忍受。 笔者只好百度,google解决方法,发现一篇文章说改 //1.3.3版本是这样的,其它版本也是这句代码 $(_1e0).html(_1e4.join("")); 改为: $(_1e0)[0][removed] = _1e4.join(""); 笔者找了类似的地方修改,测试后结果还是一
2023-05-31 10:01:12 51KB AS data datagrid
1
数据大会2020 DataCon2020大数据安全分析大赛, :trophy: 【方向五】恶意代码分析冠军原始码和方案。 最终排名(部分) 赛题回顾 启发与思路 资格赛中获得的启发 ①〜②:需要关注虚拟机,调试软件,反编译软件,逆向分析工具和杀软名 ③〜⑤:需要关注系统关键路径,位数 ⑥〜⑦:需要关注域名,IP,端口,钱包地址,可见字符串 ⑧ ⑩:同③ ⑤ 逆向工程中得到的思路 通过逆向分析,发现许多样本函数名包含数据货币名,密码学算法名(哈希算法)。 很多带壳样本:UPX,Pelite,VMP…… 白样本含有很多其他类别恶意程序,如病毒,外挂…… 算法与模型 复赛环境建设说明: 复赛预脚本: 复赛测试脚本: 重复赛一键验证测试脚本: 本次初赛,附加赛与复赛我们队使用的五种算法或模型如下(其中在复赛中因为有性能的需求,部分模型未使用): 灰色图 PE文件二进制每一个字节对应一个变量,最后缩放
2023-05-23 23:24:42 1.18MB 系统开源
1
大数据Spark企业级实战 PDF电子书 带书签目录
2023-05-23 14:44:49 12.77MB 大数据 Spark 企业级实战 PDF电子书
1
本文介绍了实用标准文案目录中的第一部分——绪论。绪论包括项目背景和提出问题两个部分。其中,项目背景介绍了本文所涉及的主题——大数据仓库与大数据挖掘课程设计的背景和意义。提出问题部分则阐述了在实际应用中,大数据仓库与大数据挖掘课程设计所面临的问题和挑战。本文旨在通过对这些问题的深入探讨,为相关领域的研究和实践提供有益的参考和借鉴。
1
该文档来自于University of Delaware电子与计算机工程系教授,计算机系统结构和并行系统实验室创始人暨主任高光荣在2014中国大数据技术大会主会的演讲“大数据系统核心技术 ”。
2023-05-18 21:51:32 2.5MB 大数据 BDTC BDTC2014
1
包含地址、区、经纬度、品牌、营业时间和分时电价、交流直流等
2023-05-17 21:37:10 573KB 数据分析 大数据 机器学习
1