三、医疗大数据的四大特征
医疗大数据呈现以下四个特点:
第一,数据量大。从 TB 到 PB 到 EB,再到 ZB,医疗大数据以 48%的年增长率快速增长(IDC,
2014)。这些数据早已超过了人力所能处理的极限。预计到 2020 年,全球医疗大数据将达到
2314EB,已经达到了 ZB 级别。
第二,数据种类多。医疗数据中既有结构化的数据,也有非结构化的数据。结构化数据包括
Oracle、MySql 等数据库的数据,半结构化数据如 XML 文档,非结构化数据包括 Word、PDF、
音视频、影像等。多种类型的数据对数据的处理能力提出了更高的要求。
第三,数据产生快,处理快。医疗信息服务中会存在大量在线或实时数据分析处理的需求。需
对数据进行实时或准实时的处理、秒级的查询需求响应。例如临床中的诊断和处方数据,健康
指标预警等。
第四,数据缺乏标准。各个医生、各家医疗机构、各个地区的数据没有统一的规范标准,数据
的质量不佳。患者的基础信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信
息重复或标准不一致,很难得到有效利用。
1