基于DINOV2模型的图像相似度计算完整代码和数据
2024-01-12 19:32:49 309.18MB
1
Unity C#使用pHash算法实现图片相似度计算(判断俩张图片是否相似)。
2023-05-31 10:44:52 91KB C# Unity 算法
文本相似度计算作为中文信息处理中的一项基础性技术,被广泛应用到文本分类、文本聚类、信息检索等多个领域,长期以来受到了众多学者的关注和研究。在信息大爆炸所带来的大量文本信息的数据堆积中,很大一部分是短文本数据或短语数据,因此,在短文本数据信息的处理问题上,短语的相似度计算变得越来越重要。本文就是针对中文短语信息的处理问题,提出了一种新的中文短语相似度计算方法。在算法的设计过程中,本文分析了短语间相匹配文字的位置、匹配位置的偏移值、匹配文字长度等多种因素,提出了中文短语间相似度的计算公式,并给出了该算法的实现代码。
1
1.使用Eclispe开发,jdk1.6+ 2.项目编码方式设置为"GBK",请勿使用其他编码方式,以免出现乱码问题。 3.辞典文件放置在dict目录下,由"中文自然语言处理开放平台(http://www.nlp.org.cn)" 提供。 4.自然语言处理开放资源许可证 随代码一起发布。 5.算法参数使用《基于<知网>的词汇语义相似度计算》的实验参数,具体定义在类WordSimilarity中, 为私有静态常量,可根据需要自行修改。
2023-02-19 10:41:56 948KB HowNet
1
Extended-SimGNN-master源代码(SimGNN方法代码,精华版,可直接运行)
2023-02-14 15:16:57 770KB GNN GCN 图相似度计算 深度学习
1
目前,问句相似度的计算主要借鉴普通陈述句的相似度计算方法。由于普通陈述句的相似性更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而以获取问句的深层语义信息,以提高问句相似度计算的准确性。实验验证了该方法的有效性。
1
比较两个字符串的相似度,利用Levenshein算法计算出两个字符串的最小编辑距离,根据最小编辑距离得出相似度,例如: 字符串1:1234 字符串2:51234,则他们的相似度为:4/5。
2022-11-28 18:05:56 234KB DELPHI Levenshtein
1
在MATLAB中计算两个正态云模型之间的相似度,源代码,数值可修改
1
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Mover's Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。
2022-06-23 11:19:25 1.18MB 短文本; EMD距离; 词向量; 相似度计算;
1
nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题 nlp 语意、义相似度计算 和 对仗计算基本覆盖所有nlp 任务评估问题
2022-06-06 19:10:38 49.62MB 自然语言处理 人工智能 nlp