SimMetrics
相似度和距离量度的Java库,例如Levenshtein距离和余弦相似度。 所有相似性指标均返回归一化值,而不是无限制的相似性分数。 距离指标返回非负无界分数。
用法
为了方便快捷地使用, 和包含一组众所周知的相似性和距离度量。
String str1 = " This is a sentence. It is made of words " ;
String str2 = " This sentence is similar. It has almost the same words " ;
StringMetric metric = StringMetrics . cosineSimilarity();
float result = metric . compare(str1, str2); // 0.4767
和是用于构建字符串相似度和距离度量的便捷工具。
2023-03-03 17:21:18
250KB
Java
1