大数据管理:数据集成的技术、方法与最佳实践
2021-11-18 13:57:46 2.93MB 大数据 管理 数据集成
1
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。 Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。 作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。这是其API文档的CHM格式,方便查阅携带。 从之前发布其他chm文件下载用户的反映看,有不少朋友反映下载后打开无法显示,这一般不是chm文件的问题,这里统一说明一下解决办法: 如果文件打开看不到右边的内容,是因为你的操作系统为了安全对下载的chm文件进行了锁定,只需要在打开前右键单击该chm文件选择“属性”,然后在“常规”选项卡的下方单击“解除锁定”按钮就可以了。如果还是不能看,请再查看一下你的chm文件所存储的目录或文件名是否有特殊字符如“#”号字符等,去掉特殊字符即可。
2021-11-02 09:07:42 16.72MB kettle PDI ETL 数据集成
1
数据集成方案:Oracle+Hadoop,R+Hadoop ... x+Hadoop,数据集成实战案例
2021-11-01 23:59:46 1.1MB 大数据 Hadoop
1
drive_ros_localize_inertial_navigation_system:仅基于IMU数据的惯性导航系统。 通过IMU数据集成创建里程表
2021-09-25 10:43:05 12KB localization ros imu drive
1
升降轨InSAR与GPS数据集成反演西安形变场.pdf
2021-09-08 13:02:39 1.05MB GPS 定位系统 系统开发 参考文献
近20年里,数据产生的方式不断得到扩展,带来数据管理需求和任务的不断变化,促使数据管理技术不断推陈出新。数据库管理系统、数据仓库与数据挖掘、数据集成被视为三足鼎立的现代数据管理技术,它们在构建信息系统中的作用相当、互为依存、缺一不可。但数据集成技术缺乏像数据库系统、数据挖掘广为人知的专业教材,使得该技术虽“叫好(广为应用)”,但“不叫座(缺乏教学传播)”。大学鲜有开设此类课程,其知识的积累多散见论文、系统。《计算机科学丛书:数据集成原理》可以说一举改变了数据集成没有专业教材的困局,尤其在当今大数据背景下,其作用尤为突出。   数据集成主要用来解决跨多个数据源的查询处理问题。《计算机科学丛书:数据集成原理》是有关数据集成技术的集大成之作。全书是以教科书的逻辑整理有关内容,强调知识的基础性和理论性。主要讨论以下问题:如何对数据库思想进行扩充和深化,从而使其能够容纳外部信息源,处理Web的分布式特性和信息共享带来的问题,特别是异构性和不确定性。   《计算机科学丛书:数据集成原理》内容主要包括三部分。第一部分以数据库课程涵盖的研究主题为基础,主要关注数据集成领域的基本技术,如查询的表示、数据源的描述、模式匹配、查询处理、集成方法等:穿插补充了Web数据集成的内容,如包装器、数据匹配(实体识别)等。第二部分主要介绍扩展数据集成的知识,包括×ML、语义Web、不确定性、数据溯源等。第三部分介绍了解决特定集成问题的创新框架,包括Web数据集成、基于关键字的按需集成、对等集成、协同集成等。最后介绍了数据集成技术的主要研究方向。
2021-08-29 17:40:20 62.78MB 数据集成 原理
1
数据集成原理 (美)AnHai Doan Alon Halevy Zachary Lves 著 孟小峰 马如霞 马友忠 等译
2021-08-29 17:34:49 44.78MB 数据
1
1、windows、linux服务上kettle的安装方案 2、Spoon、Kitchen、Pan、Carte命令使用 3、数据库资源集操作案例
2021-08-27 19:02:09 2.5MB 数据集成 kettle pdi ETL
1
Informatica 数据集成管理解决方案.pdf
2021-07-23 22:04:57 486KB informatica 数据
1