这是一份文本相似度论文集,作为第一个开始
2021-12-29 15:23:37 7.14MB 论文
1
机电一体化 MapReduce 的余弦相似度 描述 该存储库说明了 CSMR 算法的实现。 说明 CSMR 算法的论文已在 2014 年人工智能应用和创新 (AIAI 2014) 会议上发表,标题为“CSMR: A Scalable Algorithm for Text Clustering with Cosine Similarity and MapReduce”。 纸 链接: : 指示 安装 Mahout 0.9 版本和 Hadoop 1.2.1 稳定版 进入 CSMR 目录: cd Cosine-Similarity-with-MapReduce 构建 CSMR: mvn install 在 Cosine-Similarity-with-MapReduce/bin 中添加带有原始格式文档的输入文件夹(将其命名为“输入”) 运行 CSMR: ./run-csmr.sh 查看
2021-12-28 16:41:59 18KB Java
1
网络爬虫 具有相关检查的爬虫,对每个页面(URL)均使用TFIDF和余弦相似度方法
2021-12-28 11:03:46 38KB Java
1
基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar
1
图像比较 比较两个图像,并将其相似性评级为(0-100)。 程序执行步骤 使用Visual Studio打开“图像比较.sln”。 运行程序。 或在“ ImageComparison / WindowsFormsApplication1 / bin / Debug”文件夹中运行Image comparison.exe。
2021-12-25 15:12:49 62KB C#
1
Treesimi 计算树之间的相似度,例如依赖树 将邻接表转换为嵌套集表 例如,CoNLL-U的['id', 'head']字段形成依赖关系树的邻接列表。 遍历邻接表比读取嵌套集慢。 因此,如果我们以后需要多次读取这三个表,则将邻接表一次转换为嵌套集表是有意义的。 import treesimi as ts adjac = [( 1 , 0 ), ( 2 , 1 ), ( 3 , 1 ), ( 4 , 2 )] nested = ts . adjac_to_nested ( adjac ) # columns: node id, left, right, depth # [[1, 1, 8, 0], [2, 2, 5, 1], [4, 3, 4, 2], [3, 6, 7, 1]] 演示:查询嵌套集表 要提取子树,我们只需要遍历列表($ O(n)$) _ , lft0 , rgt0
2021-12-22 17:01:00 24KB Python
1
改进的SIFT结合余弦相似度的人脸匹配算法
2021-12-19 22:55:00 1.62MB 改进的SIFT结合余弦相似度的人
1
本例介绍如何用c调用libsvm,代码简单,有说明,学习者一学就会,
2021-12-19 12:08:38 5.36MB libsvm相似度
1
Java 基于知网的词汇相识度计算
2021-12-16 10:35:58 7KB Java 相识度计算
1
领域文本相似度计算方法研究.pdf
2021-12-14 12:01:49 12.88MB 资料