Java字符串相似度
一个实现不同字符串相似度和距离度量的库。 当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表...
下载
使用Maven:
info.debatty
java-string-similarity
RELEASE
或检查。
该库需要Java 8或更高版本。
总览
下面介绍了每种已实现算法的主要特征。 “成本”列给出了计算成本的估算值,以分别计算长度为m和n的两个字符串之间的相似度。
归一化?
公制?
类型
成本
典型用法
距离
没有
是
O(米* n) 1
距离相似
是
没有
O(米* n) 1
距离
没有
没有
O(米* n) 1
光学字符识别
3
距离
没有
是
O(米* n) 1
3
距离
没有
没有
O(米* n) 1
相似距离
是
1