weka是一款简单易用的数据分析软件,这个软件包括已经存在的算法以及可以自己添加算法,简单而且直观
2021-10-05 22:31:33 48.45MB 数据挖掘 数据分析
1
完整版基于R语言的数据挖掘数据分析实操案例 2000到2015年豆瓣共47000部电影数据分析 从数据抓取到数据分析全流程案例
2021-10-01 09:04:47 2.49MB
北京邮电大学的数据挖掘\数据分析课件 数据挖掘\数据分析课件
2021-09-16 10:49:18 4.58MB 数据挖掘
1
python数据挖掘数据集 python_friends.json
2021-09-11 19:44:20 1.87MB python数据挖掘入门与实践
1
云计算的定义 云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。 GFS的假设与目标 硬件出错是正常而非异常 系统应当由大量廉价、易损的硬件组成 必须保持文件系统整体的可靠性 主要负载是流数据读写 主要用于程序处理批量数据,而非与用户的交互或随机读写 数据写主要是“追加写”,“插入写”非常少 需要存储大尺寸的文件 存储的文件尺寸可能是GB或TB量级,而且应当能支持存储成千上万的大尺寸文件
2021-09-06 13:13:33 6.85MB 大数据 云计算 数据挖掘 数据分析
非常出名的movielens数据集,已转过格式,原先的文本格式只使用linux,转换后的可以在windows下使用~
2021-09-02 15:30:37 4.58MB 数据挖掘 数据 movielens 推荐系统
1
第1章 决策支持系统的发展 1.1 演化 1.2 自然演化式体系结构的问题 1.3 开发生命周期 1.4 硬件利用模式 1.5 为重建工程创造条件 1.6 监控数据仓库环境 1.7 小结 第2章 数据仓库环境 2.1 数据仓库的结构 2.2 面向主题 2.3 第1天到第n天的现象 2.4 粒度 2.5 探查与数据挖掘 2.6 活样本数据库 2.7 分区设计方法 2.8 数据仓库中的数据组织 2.9 审计与数据仓库 2.10 数据的同构/异构 2.11 数据仓库中的数据清理 2.12 报表与体系结构化环境 2.13 各种环境中的操作型窗口 2.14 数据仓库中的错误数据 2.15 小结 第3章 设计数据仓库 3.1 从操作型数据开始 3.2 数据/过程模型与体系结构化环境 3.3 数据仓库与数据模型 3.4 数据模型与迭代式开发 3.5 规范化/反向规范化 3.6 元数据 3.7 数据周期——时间间隔 3.8 转换和集成的复杂性 3.9 数据仓库记录的触发 3.10 概要记录 3.11 管理大量数据 3.12 创建多个概要记录 3.13 从数据仓库环境到操作型环境 3.14 数据仓库数据的直拉操作型访问 3.15 数据仓库数据的间接访问 3.16 数据仓库数据的间接使用 3.17 星形连接 3.18 支持操作型数据存储 3.19 需求和Zachman框架 3.20 小结 第4章 数据仓库中的粒度 4.1 粗略估算 4.2 规划过程的输入 4.3 溢出存储器中的数据 4.4 确定粒度级别 4.5 一些反馈循环技巧 4.6 确定粒度级别的几个例子 4.7 填充数据集市 4.8 小结 第5章 数据仓库和技术 5.1 管理大量数据 5.2 管理多种介质 5.3 索引和监控数据 5.4 多种技术的接口 5.5 程序员/设计者对数据存放位置的控制 5.6 数据的并行存储和管理 5.7 语言接口 5.8 数据的有效装裁 5.9 有效利用索引 5.10 数据压缩 5.11 复合主键 5.12 变长数据 5.13 加锁管理 5.14 只涉及索引的处理 5.15 快速恢复 5.16 其他的技术特征 5.17 DBMS类型和数据仓库 5.18 改变DBMS技术 5.19 多维DBMS和数据仓库 5.20 在多种存储介质上构建数据仓库 5.21 数据仓库环境中元数据的角色 5.22 上下文和内容 5.23 刷新数据仓库 5.24 测试问题 5.25 小结 第6章 分布式数据仓库 第7章 主管信息系统和数据仓库 第8章 外部数据与数据仓库 第9章 迁移到体系结构化环境 第10章 数据仓库和Web 第11章 非结构化数据和数据仓库 第12章 大型数据仓库 第13章 关系模型和多维模型数据库设计基础 第14章 数据仓库高级话题 第15章 数据仓库的成本论证和投资回报 第16章 数据仓库和ODS 第17章 企业信息依从准则和数据仓库 第18章 最终用户社区 第19章 数据仓库设计的复查要目
2021-08-27 09:30:10 7.65MB 数据挖掘 数据分析 数据仓库
1
探索海量在线数据集时面临的内在机遇和挑战 学习如何使用地图和数据“混搭”方式对都市犯罪趋势进行可视化 发现“众包”和透明如何改进药物研究现状 理解当新的数据和之前存在的数据交叠时如何向用户发送警告 学习处理DNA数据的大规模基础设施
2021-08-26 00:30:17 31.34MB 数据挖掘 数据分析
1
数据仓库、数据挖掘教材:数据挖掘与知识发现.pdf
1
Airbnb 新用户的民宿预定预测,kaggle比赛完整数据集,主要包含6个csv文件,请有需要的小伙伴下载
2021-08-16 15:37:47 64.73MB 数据挖掘数据集
1