本系统是信息检索课程的一个关于文本相似度对比的程序,它是用Java设计的,你也可以直接点击里面的jar文件进行运行,本程序还可以用来防止同学进行文档作弊的作业,资源里面有还有它的使用方法。
1
hownet完整版导出的关键文本文件,包括12w词语的概念,以及所有义原的上下位关系。使用这些文件可以实现词语相似度计算。
1
WordNet Similarity 词语相似度 提供了多种计算方式
2019-12-21 20:14:30 296KB WordNet Similarity 词语相似度
1
Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相似的图片。 这种技术的原理是什么?计算机怎么知道两张图片相似呢? 根据Neal Krawetz博士的解释,原理非常简单易懂。我们可以用一个快速算法,就达到基本的效果。 这里的关键技术叫做"感知哈希算法"(Perceptual hash algorithm),它的作用是对每张图片生成一个"指纹"(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。 这是一个最简单的实现。
2019-12-21 20:14:10 244KB 图片 搜索 Java
1
从文件中读出文本 比较相似度 以链表的形式存储 统计相同单词数 相同单词出现的次数 相同单词后面跟着的4个词中的相同单词个数……加权算出相似
2019-12-21 20:13:05 259KB C++ 英文文本 相似度
1
语义相似度任务-LCQMC数据集下载。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同
2019-12-21 20:08:45 6.33MB 语义 相似度 lcqmc 语义相识度
1
在vc中用c++实现图片相似度比较_方法及源码
2019-12-21 20:03:41 8KB 图像
1
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37 9KB kmeans 中文 文本聚类 tf
1
基于相似度的社区发现分裂算法,包括GML文件的读取,相似度计算等,有实例文件可进行实验。
2019-12-21 20:01:30 21KB 社区发现 相似度 GML文件读取
1
包含jws所需的jar包 edu.mit.jwi和edu.sussex.nlp.jws.beta.11以及基于JWS写的词语相似度比较算法和JWS相关的帮助文档
2019-12-21 20:01:13 298KB jws jar包 相似度比较
1