大数据是当今全世界都在谈论的词。 数据量日复一日地从千字节增加到 Zettabytes,数据可能是连续或频繁的实时流的速度,以及来自不同来源的不同格式(结构化、非结构化和非结构化)的各种数据。半结构化)。 所有这些类型的数据都将被合并、存储、处理和分析以备将来的结果。 大数据分析因其降低成本、更快和更好的决策而广受欢迎。 由于其特定功能,它被用于医疗保健、教育、制造、银行、保险、运输、媒体和娱乐等众多应用中。医疗保健领域的数据正在Swift增长,预计近年来会显着增加。 在当今的数字世界中,必须将数据数字化。 为了通过最小化成本来提高医疗质量,必须有效地处理和分析不同类型的健康数据,如电子健康记录、基因组、行为和公共卫生,以应对新的挑战。 出于这个原因,医疗领域被考虑用于大数据分析。 本文介绍了用于处理医疗保健记录的预测性、规范性、描述性和诊断性分析类型。 要执行所有这些操作,Hadoop 是最佳选择。 Hadoop 是 Hadoop 分布式文件系统 (HDFS) 和 MapReduce 的组合。 Hadoop以其存储容量大、处理速度快、成本低、使用集群在分布式环境中工作的模型简单高效而广为人知。 因此,了解 Hadoop 的技术细节变得至关重要。 这一事实激发了深入探索 Hadoop 及其组件的灵感。 MapReduce 结果有助于预测流行病、治愈疾病、提高生活质量并防止死亡。
1