常规相似度测量方法的性能受到高维数据维数诅咒的严重影响,原因是稀疏维数和噪声维数之间的数据差异占据了很大一部分相似度,从而导致任何结果之间的差异。提出了一种基于归一化净格子空间的高维数据测量方法,将每个维的数据范围划分为几个区间,将不同维的分量映射到对应的区间上,只有相同或相邻区间的分量为了验证该方法,为验证该方法,使用了三种数据类型,并比较了七种常见的相似性测量方法。 实验结果表明,该方法的相对差异随维数的增加而增加,比常规方法高出约两个或三个数量级。此外,该方法在不同维度上的相似范围为[0,1 ],适合进行降维后的相似性分析。
2022-05-16 13:24:21 1.75MB high-dimensional data the curse of
1
大数据中心大数据资源平台建设方案.pptx
2022-05-16 12:14:18 7.1MB big data 文档资料 大数据
1
文章《windows10配置spark与pyspark》安装包第一部分,由于文件较多,分两批上传,共计3.8元,每批1.9元
2022-05-16 09:09:36 628.95MB spark 大数据 big data
hadoop-2.7.1及使用说明
2022-05-16 09:00:38 200.8MB hadoop 大数据 big data
1
“智能城市”这个词已在学术界,企业和政府中引起广泛关注,用以描述一方面由越来越多的普适计算组成并受其监控的城市,另一方面描述其经济和治理正在不断发展的城市。由聪明人制定的创新,创造力和企业家精神驱动。 本文关注的是前者,以及如何利用产生“大数据”的数字设备和基础设施来对城市进行检测,这些数据和设备可以对城市生活进行实时分析,新的技术官僚城市治理模式以及对城市的重新想象。 本文详细介绍了一些旨在对城市进行实时分析的项目,并对大数据和智慧城市主义的含义进行了批判性反思。
2022-05-15 22:07:54 369KB big data smart cities
1
Data Structures and Algorithms in Python-2013
2022-05-15 21:52:06 5.88MB python algorithms
1
elasticsearch实战及使用ppt,私有资源自己 看的
2022-05-15 14:54:07 2.1MB elasticsearch 大数据 big data
1
matlab导入excel代码近红外数据提取 用于Microsoft Excel VBA宏的近红外(NIR)数据提取工具。 NIR数据由德州仪器(TI)的DLP:registered:NIRscan:trade_mark:Nano评估模块通过扫描生成为.csv文件。 默认情况下,此代码将从.csv文件中提取吸光度数据。 您也可以根据需要进行修改。 请参阅下面的详细信息 > TIDLP:registered:NIRscan:trade_mark:纳米评估模块入门 之所以创建此简单的代码行,是因为TIDLP:registered:NIRscan:trade_mark:Nano评估模块不附带如何轻松复制NIRscan数据以进行进一步的光谱分析的方法。 因此,我必须手动打开每个.csv文件,复制数据(B23:B250) ,打开我的主要工作簿,然后将它们粘贴到转置中。 假设您有1,000个包含NIR光谱数据的csv文件。 因此,我使该过程自动化以节省一些时间和挫败感,以便我可以集中精力并花更多时间在MATLAB,The Unscrambler X和其他机器学习平台上对我的NIR光谱数据进行分析。 现在,让我们开始吧。 导入到Excel 简单的。 打开Microsoft Excel->开发人员-> Visual Basis (
2022-05-15 13:40:18 98KB 系统开源
1
中国智库大数据报告
2022-05-15 13:05:00 1.85MB big data 大数据
黑暗模式切换 在CSS中,元素的颜色是使用预定义的变量设置的。 每个主题本质上只是这些变量的一组不同的值。 在CSS html[data-theme="dark"]中声明了不同的主题。 在这里,切换键用于更改主题。 可以使用任何其他输入。 JavaScript从切换键获取输入,并更改<html>标记的data-theme属性的值。 这会导致CSS变量的值发生变化,因为深色主题具有不同的值。
2022-05-15 03:53:58 3KB HTML
1