本程序为matlab语言,用于计算云模型的,均值,特征熵,超熵。
2022-08-17 22:39:43 1KB 云模型 云相似度
1
比较多样本,字段内多样本等相关样本得出一个相似度指标分别通过Oracle函数和Mysql构建函数并作对比分析,从而结合实际样本得出靠谱的判断。
2022-07-25 19:03:26 16KB Oracle Mysql 样本相似度 字段相似度
1
介绍一下原理:RGB图像通过公式转化为灰度图像,完成图像的灰度化,建立灰度直方图,通过两幅图像的灰度直方图,以4个灰度值为一组,建立64组数据,因为灰度直方图的定义域就是0~255,所以总共有256组数据,将所得的64组数据中的每4个数据,通过加权求和,得到64个数值,这些数值便是图像的“指纹”,将两组图像的指纹映射到64维空间,得到两组64维空间向量,通过空间夹角余弦公式得到两组图像的余弦值,将余弦值加一后除二,得到的小数乘100便是相似度。 这个程序的具体实现呢,大致分为三部分:1、将图像灰度化;2、将灰度化的图像建立直方图;3、将直方图映射到多维空间得到向量后计算夹角余弦值。
2022-07-02 19:15:41 4KB 图形图像源码
1
向量 Postgres 的开源向量相似度搜索 CREATE TABLE table (column vector( 3 )); CREATE INDEX ON table USING ivfflat (column); SELECT * FROM table ORDER BY column < - > ' [1,2,3] ' LIMIT 5 ; 支持 L2 距离、内积和余弦距离 安装 编译安装扩展(支持 Postgres 9.6+) git clone --branch v0.1.7 https://github.com/ankane/pgvector.git cd pgvector make make install # may need sudo 然后将其加载到要使用它的数据库中 CREATE EXTENSION vector; 您还可以使用 、 或安装它 入门 创建一个 3
1
基于相似度聚类的Android异常检测.pdf
2022-06-23 13:07:01 7.36MB 基于相似度聚类的Android异
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Mover's Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。
2022-06-23 11:19:25 1.18MB 短文本; EMD距离; 词向量; 相似度计算;
1
句子相似度簇 sensim_cluster使用Levenshtein距离计算文本数据(来自文件)的相似度,并对结果进行聚类(分层聚类)。 聚类结果以树状图显示。 用法 准备数据文件 在下面运行该程序 # -*- coding: utf-8 -*- import sys from sensim_cluster . sensim_cluster import SensimCluster from matplotlib import pyplot as plt from scipy . cluster . hierarchy import dendrogram cluster = SensimCluster ( 'YOUR_DATAFILE_PATH' ) ids = cluster . get_ids () result = cluster . ward () mod_ids = [ id [
1
最小编辑距离,字符串相似度,即将一个字符串转换成另一个字符串所需要的最少编辑次数(编辑包括添加,删除,替换三种)
2022-06-21 16:05:31 721B 最小编辑距离
1
基于transformers+bert预训练模型在语义相似度任务上的finetune
2022-06-21 01:23:44 429.65MB bert 语义相似度 transformers
1
资源包含文件:设计报告word+项目源码 开发工具:Python 3.7 Flask opencv-python 库 numpy 库 基于一张样板图片,对九张其他图像进行相似度的计算,得到“最相似”的一张图片。尝试多种算法,并对图像检索方法进行探索。 要求:基于 PIL 库或者 OpenCV 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125233650