Python3 实现的文章余弦相似度计算
2022-01-08 16:08:17 6.32MB Python开发-其它杂项
1
基于内容相似度的图书推荐方法研究,孙承杰,商雪晶,为了向用户提供个性化的推荐服务,大多数推荐系统都从用户和商品两个角度出发。本文利用图书之间以内容上的相似性相互联系的特点
2022-01-08 13:46:14 415KB 计算机应用技术
1
xapian的使用 配合我的blog文章的一个小demo 希望各位下载者能够从中明白如何使用xapian
2022-01-07 14:56:36 10.27MB xapian 搜索引擎 相似度 文档检索
1
余弦相似度计算matlab代码计算余弦相似度 张伯超 该脚本将从免疫数据库中读取数据并计算不同特征样本之间的余弦相似度。 用法 -d name of database -s name of subject -f field of the columns used to separate data -t size threshold, lower bound clone size, see methods below 例如 bash calCosSim.sh -d lp11 -s D207 -f tissue -t 20 将计算来自数据库 lp11 的受试者 D207 的组织样本之间的余弦相似度,仅使用在至少一个组织中具有至少 20 个实例的克隆 ** 注意:您将需要访问数据库的权限,在security.cnf 中替换您的用户名和密码。 ** 方法 实例 我们认为克隆大小是独特突变序列的数量和在不同测序文库中发现的相同独特序列的所有不同实例的总和。 我们将这种混合克隆大小度量称为“唯一序列实例”。 下限克隆大小 当我们说两个隔间重叠或缺少重叠时,重要的是要确保我们对整个场景有足够的覆盖范
2022-01-06 10:58:24 4KB 系统开源
1
文本相似度计算被信息检索,问答系统,窃检测等广泛使用。 目前,大多数研究只是针对同一种语言的文本相似度,而跨语言文本相似度计算的研究很少,语言之间的差异使得跨语言文本相似度的计算非常困难,针对这种情况,本文提出了一种解决方案。基于WordNet的中文-老挝语跨语言文本相似度计算方法。 首先对医学上的中文文本和老挝文本进行预处理和特征选择,然后使用语义词典WordNet将中文文本和老挝文本转换为中间层语言,最后计算中间层中文和老挝文本之间的相似度
2022-01-06 03:30:34 581KB WordNet; middle layer language;
1
jva语言开发的案例:人类基因由4种核苷酸,分别用字母ACTG表示。要求编写一个程序,按以下规划比较两个基因序列并确定它们的相似程度。即两给出两个基因序列AGTGATG和GTTAG,它们有多相似呢?测量两个基因的相似度一种方法称为对齐。使用对齐方法可以在基因的适当位置加入空格,让两个基因的长度相等,然后根据基因的分值矩阵计算分数。
2022-01-05 09:27:51 6KB 基因,相似度
1
英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
2021-12-31 13:15:37 199.73MB 文本匹配
1
TF-IDF结合余弦相似度相似度分析 TF-IDF 优点:简单快速,结果比较符合实际情况。 缺点:以“词频”“权重”衡量一个词的重要性,仍不够全面 可能一话的词的先后顺序也会影响词语句的表达,TF-IDF无法体现 词的位置信息,出现位置靠前的词与出现位置靠后的词,都被视为 重要性相同,这是不正确的 NLP-自然语言处理 *
2021-12-30 16:26:18 2.48MB python 数据分析 自然语言处理
1
很前沿的技术,希望大家多多看看啊,我也对此有研究
2021-12-29 17:27:52 800KB 语义相似度计算
1
基于Hadoop的文本相似度计算的代码 是用TFIDF 和向量空间模型,IKAnlayze来弄的 有代码,只是用来参考的 只是一个算法的演示,用于保存,以后查看的
2021-12-29 16:06:19 2.02MB Hadoop 文本相似度 TFIDF 向量空间莫新
1