大数据的数据使用质量评价研究 作者:黄永鑫 郭彦辰 来源:《电子技术与软件工程》2018年第23期 摘要 数据质量是决定数据是否适用于预期用途的基础,尽管目前存在用于评估常规 数据质量的不同数据质量模型,但它们都没有适应大数据。为填补这一空白,本文提出 了特有的数据质量模型,该模型由三个数据质量特征组成,用于评估大数据项目中使用 中的数据质量水平:分别是上下文充分性、操作充分性和时间的充足性.该模型可以集成 到任何类型的大数据项目中,因为它独立于任何先决条件或技术,并且完成了针对大数 据的数据质量计划的所有挑战。同时该模型可以作为获得大数据分析输入数据使用质量 水平的适当方式,并且这些水平可以被理解为可信度和结果可靠性的指标。 【关键词】大数据 数据质量 使用评价 大数据正在成为处理大量数据时遇到常见问题的新型解决方案,这些问题可能 是多样化的,并且可能也会以大规模并行处理。根据要进行的分析类型,必须以特定方 式收集和安排一些具体数据,以应对各种性质(技术、概念和方法)的新挑战,即收集 的数据必须与感兴趣的领域或分析的背景相关,换句话说,数据必须对分析有价值。传 统工作中,自有数据洞察
2022-06-22 09:03:40
156KB
文档资料