英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
2021-12-31 13:15:37 199.73MB 文本匹配
1
TF-IDF结合余弦相似度相似度分析 TF-IDF 优点:简单快速,结果比较符合实际情况。 缺点:以“词频”“权重”衡量一个词的重要性,仍不够全面 可能一话的词的先后顺序也会影响词语句的表达,TF-IDF无法体现 词的位置信息,出现位置靠前的词与出现位置靠后的词,都被视为 重要性相同,这是不正确的 NLP-自然语言处理 *
2021-12-30 16:26:18 2.48MB python 数据分析 自然语言处理
1
很前沿的技术,希望大家多多看看啊,我也对此有研究
2021-12-29 17:27:52 800KB 语义相似度计算
1
基于Hadoop的文本相似度计算的代码 是用TFIDF 和向量空间模型,IKAnlayze来弄的 有代码,只是用来参考的 只是一个算法的演示,用于保存,以后查看的
2021-12-29 16:06:19 2.02MB Hadoop 文本相似度 TFIDF 向量空间莫新
1
这是一份文本相似度论文集,作为第一个开始
2021-12-29 15:23:37 7.14MB 论文
1
机电一体化 MapReduce 的余弦相似度 描述 该存储库说明了 CSMR 算法的实现。 说明 CSMR 算法的论文已在 2014 年人工智能应用和创新 (AIAI 2014) 会议上发表,标题为“CSMR: A Scalable Algorithm for Text Clustering with Cosine Similarity and MapReduce”。 纸 链接: : 指示 安装 Mahout 0.9 版本和 Hadoop 1.2.1 稳定版 进入 CSMR 目录: cd Cosine-Similarity-with-MapReduce 构建 CSMR: mvn install 在 Cosine-Similarity-with-MapReduce/bin 中添加带有原始格式文档的输入文件夹(将其命名为“输入”) 运行 CSMR: ./run-csmr.sh 查看
2021-12-28 16:41:59 18KB Java
1
网络爬虫 具有相关检查的爬虫,对每个页面(URL)均使用TFIDF和余弦相似度方法
2021-12-28 11:03:46 38KB Java
1
基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar基于C#的文本相似度检测源代码+说明.rar
1
图像比较 比较两个图像,并将其相似性评级为(0-100)。 程序执行步骤 使用Visual Studio打开“图像比较.sln”。 运行程序。 或在“ ImageComparison / WindowsFormsApplication1 / bin / Debug”文件夹中运行Image comparison.exe。
2021-12-25 15:12:49 62KB C#
1
Treesimi 计算树之间的相似度,例如依赖树 将邻接表转换为嵌套集表 例如,CoNLL-U的['id', 'head']字段形成依赖关系树的邻接列表。 遍历邻接表比读取嵌套集慢。 因此,如果我们以后需要多次读取这三个表,则将邻接表一次转换为嵌套集表是有意义的。 import treesimi as ts adjac = [( 1 , 0 ), ( 2 , 1 ), ( 3 , 1 ), ( 4 , 2 )] nested = ts . adjac_to_nested ( adjac ) # columns: node id, left, right, depth # [[1, 1, 8, 0], [2, 2, 5, 1], [4, 3, 4, 2], [3, 6, 7, 1]] 演示:查询嵌套集表 要提取子树,我们只需要遍历列表($ O(n)$) _ , lft0 , rgt0
2021-12-22 17:01:00 24KB Python
1