1. 简述大数据的来源与数据类型 大数据的来源非常多,如信息管理系统、网络信息系统、物联网系统、科学实验系统 等,其数据类型包括结构化数据、半结构化数据和非结构化数据。 2、大数据产生的三个阶段 (1)被动式生成数据 (2)主动式生成数据 3. 感知式生成数据 3、大数据处理的基本流程 1.数据抽取与集成 2.数据分析 3.数据解释 4、大数据的特征 4V1O Volume,Variety,Value,Velocity,On-Line 5、适合大数据的四层堆栈式技术架构 6、大数据的整体技术和关键技术 大数据的整体技术一般包括:数据采集、数据存取、基础架构、数据处理、统计分析 、数据挖掘、模型预测和结果呈现等。 大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、开 发大数据安全大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大 数据应用、大数据安全等)。 7、新一代数据体系的分类 新一代数据体系中,将传统数据体系中没有考虑过的新数据源进行归纳与分类,可将 其归纳到线上行为数据与内容数据两大类别。 8、EDC系统的定义 临床试验电子数据采集(Elect
2022-06-21 13:04:31
721KB
文档资料