上传者: laoge
|
上传时间: 2021-08-29 17:40:20
|
文件大小: 62.78MB
|
文件类型: PDF
近20年里,数据产生的方式不断得到扩展,带来数据管理需求和任务的不断变化,促使数据管理技术不断推陈出新。数据库管理系统、数据仓库与数据挖掘、数据集成被视为三足鼎立的现代数据管理技术,它们在构建信息系统中的作用相当、互为依存、缺一不可。但数据集成技术缺乏像数据库系统、数据挖掘广为人知的专业教材,使得该技术虽“叫好(广为应用)”,但“不叫座(缺乏教学传播)”。大学鲜有开设此类课程,其知识的积累多散见论文、系统。《计算机科学丛书:数据集成原理》可以说一举改变了数据集成没有专业教材的困局,尤其在当今大数据背景下,其作用尤为突出。
数据集成主要用来解决跨多个数据源的查询处理问题。《计算机科学丛书:数据集成原理》是有关数据集成技术的集大成之作。全书是以教科书的逻辑整理有关内容,强调知识的基础性和理论性。主要讨论以下问题:如何对数据库思想进行扩充和深化,从而使其能够容纳外部信息源,处理Web的分布式特性和信息共享带来的问题,特别是异构性和不确定性。
《计算机科学丛书:数据集成原理》内容主要包括三部分。第一部分以数据库课程涵盖的研究主题为基础,主要关注数据集成领域的基本技术,如查询的表示、数据源的描述、模式匹配、查询处理、集成方法等:穿插补充了Web数据集成的内容,如包装器、数据匹配(实体识别)等。第二部分主要介绍扩展数据集成的知识,包括×ML、语义Web、不确定性、数据溯源等。第三部分介绍了解决特定集成问题的创新框架,包括Web数据集成、基于关键字的按需集成、对等集成、协同集成等。最后介绍了数据集成技术的主要研究方向。