编辑Matlab的距离 该软件包提供了Levenshtein,Damerau-Levenshtein的实现,以及字符串以及键列表(即字符串的单元格数组)的加权编辑距离。 该代码可引用吗? (用于研究项目) 该代码是[1]中描述的工作的一部分。 在[1]中,应用了编辑距离来匹配在引用对象时出现的语言描述(以便在人机对话/人机对话中获得共同的关注)。 [1] B. Schauerte, G. A. Fink, "Focusing Computational Visual Attention in Multi-Modal Human-Robot Interaction," in Proc. ICMI, 2010. 接触 鲍里斯·绍尔特(Boris Schauerte)
2023-04-12 11:05:51 14KB MATLAB
1
基于时间序列编辑距离的阿尔兹海默症辅助诊断,赵翼飞,李炜,计算机辅助诊断一直是机器学习中的热门领域,其中,阿尔兹海默症的辅助诊断对于该疾病的及早干预治疗有着重要意义。近年来,基于
2023-04-04 15:31:23 335KB 模式识别
1
SimMetrics.Net SimMetrics是一个相似性度量库,例如,从编辑距离(Levenstein等)到其他度量(Chapman等)。 地位 AppVeyor Travis codecov.io coveralls.io NuGet 支持的框架是: .NET 2.0 .NET 3.5 .NET 4.0 .NET 4.5及更高版本 .NET Standard 1.0到.NETStandard 1.6(包括便携式,Windows Phone和uap) .NET标准2.0 基于以及原始项目中的所有87个单元测试。
2023-03-03 17:20:22 6.73MB algorithms string string-metrics distance-metric
1
fasta算法,Smith-waterman算法,编辑距离算法,最长公共子串算法
2022-12-16 18:25:34 209KB fasta,SW
1
NULL 博文链接:https://biansutao.iteye.com/blog/326008
2022-11-13 16:08:00 603B 源码 工具
1
主要介绍了Python实现计算最小编辑距离的相关代码,有需要的小伙伴可以参考下
2022-09-11 15:19:51 46KB Python 最小编辑距离
1
最小编辑距离,字符串相似度,即将一个字符串转换成另一个字符串所需要的最少编辑次数(编辑包括添加,删除,替换三种)
2022-06-21 16:05:31 721B 最小编辑距离
1
PQ-Grams 是一种有效评估树结构/内容相似性的方法,用于可以抽象为嵌套(标签、儿童)对的树结构。鉴于此前提,单个 PQ-Gram 是前 P 个祖先标签(包括当前节点)和下一个 Q 子标签。PQ-Gram 配置文件是一棵树中所有 PQ-Gram 的集合,包括填充每个子集的左侧和右侧的“填充器”节点,以及祖先树的顶部。 然后可以将这些 PQ-Gram 与 NLP 中的 n-Gram 或 shingles 类似地使用,通过集合并集和集合差异度量来评估树之间的相似性。最初的用法是执行类似集合差分的操作来计算近似的树编辑距离
2022-06-12 14:05:24 10KB 算法 rust
如果是A串的第i个字符和B串的第j个字符 1.在A的第i个字符后插入一个字符B[j],问题转化为计算A[i...lenA]和B[j+1...lenB]的距离 2.删除A串的第i个字符,问题转化为计算A[i+1...lenA]和B[j...lenB]的距离 3.将A的第i个字符替换成B的第j个字符,问题转化为计算A[i+1...lenA]和B[j+1...lenB]的距离。于是替换操作的编辑距离就是d[i-1][j-1]+flag。其中,当A[i]==B[j]时,flag=0, A[i]!=B[j],flag=1 d [i-1][j] 、d [i][j-1]、d [i-1][j-1]进行比较,其中最小的就是当前A和B的编辑距离
2022-06-10 12:02:57 993B 动态规划
1
本文提出了一种基于树和基于令牌的方法相结合的高速,高精度代码克隆检测方法。 重复的程序代码(称为代码克隆)的存在是降低软件质量和可维护性的主要因素之一。 如果一个代码片段包含错误(错误),并且将它们复制并修改到其他位置,则必须更正所有错误。 但是在大型复杂软件中查找所有代码克隆并不容易。 对于代码克隆检测已经做了很多研究工作。 代码克隆检测主要有两种方法。 一种是基于令牌的方法,另一种是基于树的方法。 基于令牌的方法速度快,所需资源更少。 但是,它无法检测所有类型的代码克隆。 基于树的方法可以检测所有类型的代码克隆,但速度慢且需要大量计算资源。 本文提出了这两种方法的组合,以提高检测代码克隆的效率和准确性。 首先,将通过基于令牌的快速而轻量级的方法来提取一些代码克隆的候选对象。 然后,将使用可找到各种代码克隆的基于树的方法来更精确地检查选定的候选对象。 开发了原型系统。 该系统接受源代码并在第一步中对其进行标记化。 然后将基于令牌的方法应用于此令牌序列以查找代码克隆的候选对象。 在提取了几个候选者之后,选定的源代码将转换为抽象语法树(AST),以应用基于树的方法。 一些示例源代码用于评
1