算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37 9KB kmeans 中文 文本聚类 tf
1
基于相似度的社区发现分裂算法,包括GML文件的读取,相似度计算等,有实例文件可进行实验。
2019-12-21 20:01:30 21KB 社区发现 相似度 GML文件读取
1
包含jws所需的jar包 edu.mit.jwi和edu.sussex.nlp.jws.beta.11以及基于JWS写的词语相似度比较算法和JWS相关的帮助文档
2019-12-21 20:01:13 298KB jws jar包 相似度比较
1
基于HSV色彩空间和LBP算法编写的图像内容的相似度判别,可用来判断两张图片的相似度情况,使用matlab编写。
2019-12-21 20:00:39 265KB 图像相似度
1
采用动态规划思想,根据最优子结构性质,求出对比代码的最长公共子序列,从而判断对比代码的相似度。本系统把分词技术和最长公共子序列有机的结合,将对比代码分割成单词或标点符号,以单词和符号为检测单元,有效的提高了检测的精准度
2019-12-21 19:59:58 4.8MB JAVA 重复率检测 相似度 源程序文件
1
使用java调用HanLP分词器实现两个文本相似度对比,可以很快对比出百分率(1=100%)
2019-12-21 19:59:35 15KB 文本比对 相似度 HanLP
1
调用百度AI平台上的短文本相似度API,调用api接口,实现测试。
2019-12-21 19:56:46 2KB java
1
该压缩包包含编译方式,示例代码,只需拍两张图片即可比较,比较打印输出值小于10,即为相似图片。使用改代码的用户linux系统必须先安装opencv环境.
2019-12-21 19:54:33 414KB opencv
1
词语相似度计算,语义计算,用于人工智能,自然语言处理,数据挖掘,舆情分析等众多领域。
2019-12-21 19:50:51 372KB 同义词
1
最新的词语相似度计算方法;基于词林和知网的词语相似度计算;版权归原作者所有,仅供学习交流使用;
2019-12-21 19:50:51 4KB 相似度新算法
1