为了实现自动化的数据质量评估,提出了一种在背景范围内的数据质量量化方法QDC(Quantify Dimensions within Context)。数据质量可以用数据和其对应实体的“完美表达”间的差距来衡量。由于“完美表达”很难获得或代价很高,因此提出在多数据源条件下,数据的“完美表达”可以在其背景范围内用投票获得的“最近似”来替代,从而确定了数据质量评估参照的标准。同时提出利用信息论中信息熵指标,将不同类型数据的质量维度统一为通用的度量。作为一种自动化的数据质量评估方法,QDC方法不仅能够对数据的准确性和完整性维度给出准确的评估值,并且具有很高的计算效率。
2021-11-24 10:23:51 1.06MB 论文研究
1
今天看代码时,遇到了一个令我有点惊讶的一个赋值问题。 虽然是一个很小很小的问题,很多人可能都不会纠结一看就懂,但对于我来说还是攻克了一个难关涨了点姿势呀 下面附上我追根究底的简单代码: clc; a=[1 2 3 4 5,6,7,8 9 10 11 12]; %a(1,10:13)=2:5;  %没错  难道可以这样赋值??惊讶  此时a_len = 13 %a(10:13)=2:5;     %也不错 与a(1,10:13)=2:5; 等价 %a(10:13)             %若不赋值,只是通过下标访问数组  则会出现错误:索引超出矩阵维度。 %%%%上边所示都是一维数组 b=[1
2021-11-13 15:02:29 37KB matlab matlab矩阵 数组
1
采用国内自主开发的高分辨率显微CT设备,对岩芯样本进行图像采集,运用数字图像分析方法获得图像中的岩芯孔隙目标,并以此为基础重建三维模型。然后基于分形理论,分别从二维图像和重建的三维模型角度计算孔隙的分形维数。最后,再采用基于多孔介质的分形模型对岩芯孔隙分形特征进行验证,得出岩芯的二维分形维数和三维分形维数之间的差值均值为1.000 3, 最大偏差为0. 004,很好地满足多孔介质分形模型中关于二维和三维分形维数的关系。
2021-11-10 15:51:51 11.75MB 显微ct图像 分形维度 matlab
1
深度学习-处理多维度特征的输入 -Multiple Dimension Input-自用笔记6的糖尿病数据集
2021-11-04 18:33:55 13KB 深度学习
1
数据仓库建模 Powerdesigner 维度建模 软件分析 建模 视频教程
2021-11-03 14:37:57 49B 建模
1
内容:其中包含2002、2011、2017三年国民经济行业分类和代码的MySQL文件,每一个表的格式如下:例如第一列是“ A0111 ”,那么第二列就是“ 农、林、牧、渔业·农业·谷物及其他作物的种植·谷物的种植 ”,三年的行业代码和分类做了汇总统计,每一个代码分为四级结构,“门类·大类·中类·小类”。 适用人群:需要对数据进行行业维度的清洗和标准化的大数据技术人员。
内容:压缩包有6个excel文件,分别对应2002,2011,2017年三年的国民经济行业分类与代码表,每一年的表有两个,其中一个是国家统计局发的原版,另一个是经过处理的简化版。简化版表格共有两列,其中一列是编码,另一列是编码对应的名称,比如第一列是”“A”,对应的第二列就是“农、林、牧、渔业”。 适用人群:需要做行业维度的数据分析和数据清洗的相关技术人员,需要国民经济行业分类与代码excel表的人员。 使用场景:主要用于行业分类和编码的标准化。
数据仓库体系全套模板,共6份,包括命名规范、事实表梳理、维度梳理、业务梳理及标体系梳理等。 模板-命名规范 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板-数据仓库整体设计方案
2021-10-14 19:06:00 433KB 数据仓库 体系模板
行政区域维度表、时间维度表、日期维度表,表结构、表数据、建表语句、生成数据的python脚本。
2021-10-14 18:05:35 641KB 数据仓库 维度表
VB6.0程序,可以在一个沿3轴转动的空间种显示散点图。
2021-10-14 12:04:29 497KB VB6 3D 散点图
1