绝大部分的大数据需求都来自于Internet技术的爆炸,这已经不是什么秘密。面向公众的应用程序可以拥有几百万用户,这个想法在10-20年前是闻所未闻的。如今,即使是一个普通网站,也可能拥有数百万用户,如果这些用户是活跃的,那么每天可能产生数百万个数据项。具有讽刺意味的是,创建大数据的基础架构和系统也可以反向工作,提供一些更好的方法来集成和使用该数据。有用的是,InfoSphereBigInsights通过一个简单的RESTAPI支持数据作业的管理和执行。通过Jaql接口,我们可以运行查询,并直接从Hadoop集群中获取信息。本文将重点介绍这些系统如何协同工作,为捕捉数据提供丰富的基础,并提供了
1