余弦相似性获取文章相似度的java实现,tf-idf算法实现
2021-12-13 17:16:48 71KB 文件相似度
1
这是一个类,里面包含的有关文本相似度的常用的计算算法,例如,最长公共子序列,最短标记距离,TF-IDF等算法 例如简单简单简单的用法:创建类实例,参数是两个文件目录,之后会生成两个字符串a.str_a, a.str_b
2021-12-12 14:04:23 9KB Python开发-其它杂项
1
文本相似度计算的简单实例超详细代码解释(附代码,文件)-附件资源
2021-12-07 23:42:51 106B
1
本人的数据结构实习作业“基于Hash表的代码相似度度量”,代码简洁明了,可读性强,并附带较多的注释,方便他人查看。一般通过查看注释便能了解程序的结构与功能,方便进行修改。以下是实习作业的具体要求: 对于两个C++程序,设计并实现两种不同的基于Hash表的检测算法(开地址法和链地址法),计算两个程序的相似度,并分析比较两种算法的效率。 分别读取两个C++程序文件(p1.cpp, p2.cpp),自行设计哈希函数,分别利用开放地址法和链地址法的冲突解决方案,构建C++语言关键字的Hash表。在扫描源程序的过程中,每遇到关键字就查找相应Hash表,并累加相应关键字出现的频度。 根据统计的两个程序中关键字不同频度,可以得到两个向量X1,X2。通过计算向量X1和X2的相对距离来判断两个源程序的相似性,相对距离s的计算方法是( T表示向量的转置) |X1—X2| ((X1—X2)(X1—X2)T)1/2 s= ———————— = ——————————————— |X1|1/2•|X2|1/2 (X1•X1T)1/2(X2•X2T)1/2 利用开放地址法和链地址法两种不同的冲突解决方案构建,分别输出s和两种方法计算s所用的时间。 读取C++程序时,过滤注释,不考虑注释中的内容。(两种注释//和/*…*/) 采用二叉排序树来统计其中的关键字及其频度,按照上述公式计算s,同时给出计算s所用的时间。
2021-12-06 23:44:41 19KB Hash 开地址 链地址 相似度
1
根据图像直方图来比较两幅图像的相似性。 比如有图像A和图像B,分别计算两幅图像的直方图,HistA,HistB,然后计算两个直方图的归一化相关系数(巴氏距离,直方图相交距离)等等。
2021-12-06 12:39:35 295KB 图像相似度计算 图像
提出一种基于协同过滤的网络论坛个性化推荐算法,根据用户的发帖、回帖、阅读等记录,采用加权方法计算用户帖子的评分矩阵,获取邻近用户集合,通过邻居用户的帖子评分,计算目标用户的帖子预测评分,推荐预测评分最高的帖子。实验结果表明,该算法的推荐质量较高。
1
基于相似度的神经网络多源迁移学习算法 基于相似度的神经网络多源迁移学习算法 基于相似度的神经网络多源迁移学习算法
2021-12-01 11:00:54 1.49MB ieee论文
1
如果您传入 2 个向量,它会返回向量之间的非标准化距离、它们之间的累积距离、扭曲路径的长度(标准化因子)、扭曲路径点和两个扭曲的输入向量。 如果选择 pflag=1,您也可以绘制结果
2021-11-30 21:04:51 5KB matlab
1
ChineseSimilarity-gensim-tfidf """ 基于gensim模块的中文句子相似度计算 思路如下: 1.文本预处理:中文分词,去除停用词 2.计算词频 3.创建字典(单词与编号之间的映射) 4.将待比较的文档转换为向量(词袋表示方法) 5.建立语料库 6.初始化模型 7.创建索引 8.相似度计算并返回相似度最大的文本 """ 可直接运行ChineseSimilartyCaculation.py stopwords.txt为中文停用词表
2021-11-29 20:54:31 10KB Python
1
使用Resnet50进行图像相似度检测 介绍 给定一批图像,该程序将尝试使用基于Resnet50的特征向量提取来找到图像之间的相似性。 用法 python kreas_resnet50.py会将images文件夹中存在的所有图像python kreas_resnet50.py比较,并为每个图像提供最相似的图像。 先决条件 下载 使下载的Shell脚本可执行并安装 conda -V检查安装是否成功。 conda update conda和conda update anaconda conda update scikit-learn conda install theano conda install -c conda-forge tensorflow pip install keras export MKL_THREADING_LAYER=GNU 注意:有关更多描述性说明
2021-11-26 17:06:29 1.49MB python keras feature-vector image-similarity
1