上传者: 43934844
|
上传时间: 2022-06-22 09:03:57
|
文件大小: 312KB
|
文件类型: PDF
大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无 法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量 (volumes)?大,指代大型数据集,一般在 10TB?规模左右,但在实际应用中,很多企 业用户把多个数据集放在一起,已经形成了 PB 级的数据量;其次是指数据类别 (variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定 的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度 (Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一 个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据 等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确 保其真实性及安全性。 百度知道—大数据概念 大数据(bigdata), 或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目 前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营 决策更积极目的的资讯。大数据的 4V 特点:Volume、Velocit