使用最短编辑距离算法判断两个字符串的相似度
1
FastFuzzyStringMatcher FastFuzzyStringMatcher是用于快速内存中字符串匹配的BK树实现。 (也可用于 )。 特征 快速,模糊,字符串匹配。 根据百分比进行搜索并编辑距离。 将数据与字符串关键字相关联,并同时返回两者。 例如,搜索文件名,然后返回关联的文件路径。 动机 尽管哈希映射可用于精确的字符串匹配,而尝试可用于前缀匹配,但目前很少有基于编辑距离或百分比差异的快速匹配解决方案。 当然,您可以搜索集合中的每个字符串,将其编辑距离与要搜索的关键字进行比较,但这往往效率很低。 FastFuzzyStringMatcher构建以使搜索效率更高。 设置 该项目最初是使用Eclipse和Java 8构建的,并且假设您已安装了最新的JDK,则应该干净地构建。 主类可以在src/main/java com.gitub.pekoto.fastfuzzys
1
matlab实现应用levenshtein算法对两组字符串CH1,CH2相似度的识别,得到两组字符串的相似度,leventshtein算法是有效的模式识别算法,在结构模式识别中应用广泛。
2021-12-07 15:19:32 444B levenshtein
1
win10 python3.8 安装 pip install python_Levenshtein,用其.whl文件直接安装,解决缺少Visual C++ 14.0组件的问题。
2021-10-18 22:10:55 82KB python
1
处理中文地址的分词和匹配 采用混合分词算法进行中文地址分词 在中文地址分词基础上采用Double Levenshetin算法进行中文地址相似度进行地址匹配
2021-10-18 20:05:11 18.05MB 地址分词 地址匹配 Levenshtein 中文地址
1
python的工具包,可用于自然语言处理领域,如文本相似度的计算,本人已测,速度相当的快
2021-09-24 13:13:37 75KB python 相似度 Levenshtein
1
python_Levenshtein-0.12.2-cp37-cp37m-win_amd64.whl
2021-08-18 17:44:12 82KB python
1
Java字符串相似度 一个实现不同字符串相似度和距离度量的库。 当前实现了十二种算法(包括Levenshtein编辑距离和同级,Jaro-Winkler,最长公共子序列,余弦相似性等)。 查看下面的摘要表以获取完整列表... 下载 使用Maven: info.debatty java-string-similarity RELEASE 或检查。 该库需要Java 8或更高版本。 总览 下面介绍了每种已实现算法的主要特征。 “成本”列给出了计算成本的估算值,以分别计算长度为m和n的两个字符串之间的相似度。 归一化? 公制? 类型 成本 典型用法 距离 没有 是 O(米* n) 1 距离相似 是 没有 O(米* n) 1 距离 没有 没有 O(米* n) 1 光学字符识别 3 距离 没有 是 O(米* n) 1 3 距离 没有 没有 O(米* n) 1 相似距离 是
2021-08-18 10:31:38 462KB java algorithm distance jaro-winkler
1
pylon
2021-08-10 14:04:23 49KB python
1
levenshtein - 这是一个Go实现计算Levenshtein距离算法
2021-07-01 13:11:36 848KB Go开发-数据结构和算法
1