微软的ASG(应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的dataaudit服务来保证这样量级的数据完整性和实时性非常具有挑战性。本文将介绍微软ASG大数据团队如何利用Kafka、Spark以及Elasticsearch来解决这个问题。微软的ASG(应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的dataaudit服务来保证这样量级的数据
1
文档主要是数据源从抽到hive数仓,进行配置化模板来监控各个数仓层的质量问题,以及涉及到监控的页面设计
2022-12-01 09:26:58 85KB 数据质量监控
1
开题报告-基于提升数据质量来增强在模型性能研究
2022-11-21 18:03:44 760KB 12
1
天气雷达以使用相同参数标定的晴空标准地物回波强度为参考,和实时采集的回波强度进行对比分析,在实现回波强度数据质量检测的同时完成对其校正,对比参考地物及实际回波强度间误差,实现对天气雷达的回波强度数据质量检测。在误差较大的检测结果的基础上找出造成该误差的原因以及解决方案,提出了一种新型的可以快速高效的天气雷达探测数据质量控制方式,为实现天气雷达的准确探测提供了保障,使其得到的数据更为真实可信。
1
本ppt是关于数据质量测评模型与方法,需要的同学可以下载
2022-07-12 11:26:45 9.6MB 数据质量
1
人工智人-家居设计-高速公路智能交通大数据质量优化控制方法研究.pdf
2022-07-08 14:03:54 2.99MB 人工智人-家居
之前的anubis只能处理一天多站的,还需要一直修改配置文件,此程序可以化简很多繁琐步骤,希望大家共同进步!
2022-06-30 09:52:52 90.6MB 源码软件 anubis 数据质量分析 gnss
地理信息系统:12 空间数据质量与元数据.ppt
2022-06-26 20:04:01 1.62MB 地理信息系统
集团企业大数据云平台及数据质量管理平台建设方案.pptx
2022-06-21 19:04:55 11.55MB 智慧
企业级数据管控体系,在同一数据模型和业务视图的基础上,从数据整合、元数据管理、主数据管理、数据标准、数据质量、数据安全及数据共享等多个角度,通过对数据的有效管控,确保企业数据满足业务运营及管理决策的需要,为数据的有效应用打下基础。 元数据是指表示数据的相关信息,比如数据定义等,而主数据是指实例数据,比如产品目录信息等。 主数据是指在整个企业范围内各个系统(操作/事务型应用系统以及分析型系统)间要共享的数据, 比如,描述核心业务实体的数据:客户 这些主数据在进行主数据管理之前经常存在于多个异构或同构的系统中 主数据通常需要在整个企业范围内保持一致性(consistent)、完整性(complete)、可控性(controlled),为了达成这一目标,就需要进行主数据管理(Master Data Management ,MDM)。需要注意的是,主数据不是企业内所有的业务数据,只是有必要在各个系统间共享的数据才是主数据,比如大部分的交易数据、帐单数据等都不是主数据,而像描述核心业务实体的数据,而像客户、供应商、帐户、组织单位、员工、合作伙伴、位置信息等都是主数据。主数据是企业内能够跨业务
2022-06-16 14:05:01 3.93MB 元数据 数据质量