余弦相似度算法的文档。
2022-04-09 21:00:11 307KB 算法
余弦相似度算法文本相似度算法的对比及python实现五种常见的相似度算法:余弦相似度(cosine_similarity)、jaccard相似度、编辑距离(Levenshtein)、MinHash、SimHash + 海明距离。
2022-04-09 09:05:50 3KB python 算法 开发语言
chatbot_by_similarity 根据文本相似度实现问答的聊天机器人(弱智版) 项目介绍 这是根据工作需求写的一个简易版本的聊天机器人,主要目的是根据问题从知识库中匹配相应的答案,从而帮助使用者去更方便的查询到一些知识性内容。 模块简介 用法比较简单,给文本列表,经过训练后去匹配问题返回相似的答案。 结构及用法 模块由五个部分构成:测试数据、预处理分词、计算词向量、计算相似度和聊天机器人 文本的预处理(cut_text.py): 提供知识库的word文档数据和小黄鸡聊天记录 from chatbot import load_data # word数据 texts = load_data(type='knowledge') # 小黄鸡数据 texts = load_data(type='chat') 文本的预处理(cut_text.py): 用于分词、剔除停用词(这里偷懒直接把长度
2022-04-03 15:54:33 10.54MB nlp chatbot similarity-measures Python
1
内含meanshift的学习资料,如论文及PPT。还有meanshift聚类,目标跟踪,图像相似度识别的matlab函数,希望能帮到大家。不过,meanshift聚类这块,程序中并未用到核函数的概念,请大家一起交流下,谢谢大家
2022-04-01 21:06:15 11.43MB meanshift
1
功能描述 基于siamese-lstm的中文句子相似度计算 环境搭建 Ubuntu:16.04(64bit) Anaconda:2-4.4.0(python 2.7) 历史版本下载: TensorFlow:1.5.1 numpy:1.14.3 gensim:3.4.0 (nltk:3.2.3) jieba:0.39 word2wec中文训练模型 参考链接: 代码使用 模型训练 # python train.py 模型评估 # python eval.py 论文参考 代码参考 版本:a61f07f6bef76665f8ba2df12f34b25380016613 AETC2018赛题描述 相关链接:
2022-03-31 17:55:17 33.67MB Python
1
self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。
2022-03-29 17:13:03 7.51MB Python开发-自然语言处理
1
使用最短编辑距离算法判断两个字符串的相似度
1
中文文本相似度/文本推理/文本匹配数据集——LCQMC
2022-03-28 16:49:57 5.96MB 文本匹配
1
感知哈希的优点是简单快速,不受图片大小缩放的影响,缺点是图片的内容不能变更。实际应用中,往往采用更强大的pHash算法和SIFT算法,它们能够识别图片的变形。只要变形程度不超过25%,它们就能匹配原图。
1
本压缩包主要是图像结构相似度MSSIM的MATLAB程序。里面有相关例子的说明。
2022-03-27 17:21:49 92KB MATLAB MSSIM
1