比较轨迹聚类方法 这是我的模式识别课程学期项目。 目标是在民用飞行数据上比较4种聚类算法(k型,高斯混合模型,dbscan和hdbscan)。 可以在report.pdf文件中找到更多详细信息。 产生的集群如下所示: 应用轨迹分割以减少采样点的数量,并使用hausdorff距离比较轨迹之间的相似性。 更新(2019年2月) 添加了一个演示项目的每个步骤。 首先请看一下,它比项目的其他部分更短,更容易理解。 它还在公共数据集上显示了这些步骤。 公开数据集: 集群轨迹:
1
文本相似性Web应用程序 简单的Web应用程序可查找用户输入的两段文本之间的相似性 介绍: 这是一个简单的Flask Web应用程序,它接收2条文本并吐出2条文本之间的相似度百分比。该算法绝非完美。它需要更多的改进,但这是一个很好的起点。 注意事项: 标点符号将代替其原始符号。我使用了 ,其中包含许多标点符号及其扩展形式。我已将其作为json文件包含在内,因此以后任何人都可以进一步扩展。 重复的单词不会增加相似性。我将使用一组,因此重复的单词将不会计入。 我使用了一个名为“ Inflect”的库,该库将数字转换为口语单词(例如1-> 1,2-> 2等),因此涵盖了数字到文本的转换。 特殊字符将被忽略。 单词的顺序无关紧要。 算法: 实际算法是余弦相似度算法的副本。步骤如下: 从用户那里获得2个文本。 标记文本-将文本转换为单词列表。在这里,我们扩展标点符号,并用实际文本替换数字。 一旦标记
2021-03-18 17:09:04 2KB
1
基于多参数相似性测度和WDBA的区间值勾股模糊集应急决策算法
2021-03-12 14:08:09 2.63MB 研究论文
1
犹豫模糊集的新型距离和相似性度量及其在聚类分析中的应用
2021-03-04 09:07:47 210KB 研究论文
1
针对数据量庞大引起模型参数更新时样本选择困难及训练速度慢的缺陷,提出基于投影寻踪回归的铜闪速熔炼过程关键工艺指标预测方法。首先采用机器学习方式提取用于建模所需的相似样本集,借助投影寻踪回归思想,建立铜闪速熔炼过程关键工艺指标预测模型;然后利用基于实数编码的加速遗传算法进行模型参数的实时更新。训练样本的机器选择可以避免人工选择带来的主观性和盲目性缺陷,模型参数的更新训练只在相似样本集中进行,可有效提高模型参数更新速度。实际生产数据仿真结果验证了所提方法的有效性和可行性。
1
可逆数据隐藏的最小结构相似性失真
2021-03-02 13:05:54 739KB 研究论文
1
深度多实例学习的Bag相似性网络
2021-03-02 11:09:29 1.07MB 研究论文
1
通过带状自适应建模和正则化利用非局部相似性进行图像降噪
2021-02-26 12:05:45 1.12MB 研究论文
1
压缩顺序学习的动作相似性标记
2021-02-25 20:04:37 1024KB 研究论文
1
针对基于元数据或传统主题图的知识组织模式没有实现知识的多层次多粒度表示,以及知识融合过程中相似性算法准确性不高而影响融合质量的问题,结合全信息理论与扩展主题图结构特点及语义信息,提出了面向多源知识融合的扩展主题图相似性算法(ETMSC)和阈值选取的相关性、层次对应和实验确定三原则.该算法综合了语法、语义和语用的相似性,扩展了主题图元素间组成结构上的相似性,同时充分考虑了涵义及所处语境的相似性.主题图相似性的判别准则与阈值有关,阈值的确定与数据集相关.实验结果表明,ETMSC算法与单纯基于语法或语义的相似性算法相比,准确性提高了9.2%~11.1%.
2021-02-23 14:04:05 228KB 知识融合;主题图;相似性算法
1