相似文档检测 Mission data.csv中包含了一个新闻标题列表,试通过近似检测方法,通过Jaccard相似度,检测相似文章,将结果保存到csv文件中,不同文章间用空行隔开。 Work 思路: 两个词作为一段来计算,末尾不够截掉 Jaccard相关系数大于0.5则认为两个新闻标题相似 利用并查集将相似的合并在一起 Code import pandas as pd import nltk import numpy as np class Jaccard: def __init__(self, _len): # _len 为步长值,语句切分的步长值 self._len
2021-03-14 14:08:57 39KB ar c cc
1
xlm-r-distilroberta-base-paraphase-v1,在释义识别(释义识别是判断两个句子是否有相同含义的任务,是自然语言理解的标准。)方面表现出色。 使用参考sentence_transformers 的文档。
2021-03-13 22:19:40 967.08MB 预训练模型 bert 文本相似度 nlp
1
基于模式间相似度评估和多模式判别信息分析的多模式和多阶段批处理过程的理解和监控
2021-03-12 14:08:45 1.5MB 研究论文
1
基于网络爬虫技术的网络新闻分析主要用于网络数据爬取。本系统结构如下: (1)网络爬虫模块。 (2)中文分词模块。 (3)中3文相似度判定模块。 (4)数据结构化存储模块。 (5)数据可视化展示模块。 数据库:无(数据保存方式为直接生成图表) 使用技术:HttpClietn + IK分词器 + 相似度算法 开发工具:未知
2021-03-08 20:03:21 14.86MB HttpClient 相似度算法
随着移动互联网的快速发展,如何从大量的移动应用中抽取有效的描述信息继而为移动用户提供有效 准确的推荐策略变得尤为迫切。目前,移动应用市场对应用的推荐策略相对传统,大多是根据应用的单一属性进行 推荐,如下载量、应用名称、应用分类等。针对推荐粒度过粗和推荐不准确的问题,提出了一种基于潜在狄利克雷分布 ( LDA) 主题模型的移动应用相似度构建方法。该方法从应用的标签入手,构造应用的主题模型分布矩阵,利用该主 题分布矩阵构建移动应用的相似度矩阵,同时提出了将移动应用相似度矩阵转化为可行的存储结构的方法。实验结 果表明该方法是有效的,相比现有的360 应用市场推荐的应用其相似度提升130%。该方法解决了移动应用推荐过 程中推荐粒度过粗的问题,可使推荐结果更加准确。
1
通过2个指定的WAV文件进行读取并比对其相似百分比。 使用方法: 1)压缩包中的2个dll解压放入bin文件夹中,且在项目中引用dll文件 WAVECompare.dll 2)调用代码(参数60表示,相似度达到60%则算及格,程序将正整数,否则返回负整数) WAVECompare.WAVEObject objWAV = new WAVECompare.WAVEObject(); int _result = objWAV.ToCompare(60, @"E:\11.wav", @"E:\22.wav"); Response.Write(_result.ToString());
2021-03-05 11:52:11 19KB WAV声纹
1
c# OpenCvSharp 图片相似度比较,四种方法对比,SSIM,PSNR,灰度直方图比较,RGB三通道全彩直方图比较,亲测,效果不错。
1
在网上找的用灰度直方图方法计算相似度的算法写的小例子,经测试效果还可以 在网上找的用灰度直方图方法计算相似度的算法写的小例子,经测试效果还可以
2021-03-04 22:02:59 79KB c# 图片相似度
1
一个基于知网词库的词语相似度计算工具 内附知网词库源文件,如果想要了解义原层级可以通过工具查看
2021-03-04 19:10:10 2.26MB nlp 相似度计算 自然语言处理 HowNet
1
基于电流相似度分析的两级三相PWM整流器开路故障诊断
2021-03-04 11:06:04 2.05MB 研究论文
1