相似图片搜索是桌面反向图片搜索应用程序。 考虑一下Google的“按图片搜索”,但您在计算机上拥有自己的照片。 SiS可以在库中搜索相似的图像并返回匹配项列表。 我还可以将库外的库与库内的库进行比较。 它是专为摄影师设计的,用于筛选存储卡转储,分批搜索照片以便于分类。 要求:Java 7
2022-10-16 23:38:31 6.39MB 开源软件
1
特征相似度评价算法远吗,Matlab实现代码
2022-10-14 09:08:04 7KB maltab iqa fsim 图像质量评价
1
dataset-sts, 语义文本相似数据集 基于的语义文本相似集一个典型的A 学习任务包括分类一个句子或者文档序列,换句话说,逼近函数。 f_1(s) ∈ [0,1] ( f_1 可能决定域。情绪。等等 ) 。 但是,有很多问题往往难以解决,并且涉及到对句
2022-10-09 20:19:43 56.07MB 开源
1
已知一个元素,在一个list中找出相似的元素 使用场景: 已知一个其它来源的字符串, 它有可能是不完全与我数据库中相应的字符串匹配的,因此,我需要将其转为适合我数据库中的字符串 使用场景太绕了, 直接举例来说吧 随便举例: 按青岛城市的城区来说, 我数据库中存储的城区是个list:[‘市北区’, ‘市南区’, ‘莱州市’, ‘四方区’]等 从其它的数据来源得到一个城区是:市北 我怎么得到与市北相似相近的市北区 解决方案: In [1]: import difflib In [2]: cityarea_list = ['市北区', '市南区', '莱州市', '四方区'] # 正常情况下,我是
2022-09-22 10:10:38 45KB IS li list
1
近年来,基于异质信息网络的研究受到国内外广泛的关注,很多研究工作(如聚类、分类、推荐等)都是在异质信息网络上开展的。异质信息网络是一种包含不同类型节点和边的网络,它具有更加复杂的网络结构和更加丰富的语义信息,可以更全面地表示系统的组成对象和他们之间的关系。在异质信息网络中,度量节点间的相似性是开展聚类、推荐等工作的基础。目前,国内外已提出许多相似性度量方法来解决异质信息网络节点相似性度量的问题,HeteSim算法就是其中一种代表性方法。HeteSim是一种基于双向随机游走的度量方法,目前HeteSim相似度计算均采用单节点计算模式,然而随着信息网络的急剧膨胀,传统的单节点计算模式已无法满足HeteSim快速计算的需求,开发在集群上运行的HeteSim并行化算法成为当务之急。本文基于分布式计算框架Spark,研究并实现了异质信息网络相似性度量方法HeteSim的并行化算法。首先,本文提出基于矩阵乘法的HeteSim并行化算法。HeteSim并行化的核心是矩阵乘法的并行化,本文针对传统矩阵乘法并行化算法内存消耗大,网络开销大,执行时间长的缺点,提出改进算法,并基于改进算法,实现了基于矩阵乘
2022-09-21 18:07:15 4.87MB
1
利用java代码实现向量空间模型,通过词频,文档频率计算相似度的值。
相似性检查器 使用余弦相似度获取相似度图或分数 例子 从查询图像点击猫的耳朵。 然后您可以从关键图像获取相似度图。 左图是真实的余弦相似度值,右图是热图图像。 如果使用与查询图像相同的关键图像,则可以获得内部或自相似图。 或者,如果您的任务是“数字”,那么您可以获得直接相似值。 1.jpg - 1.jpg : 0.2091 这意味着图像1.jpg的内部或自我相似性得分为0.2091。 先决条件 我们使用了以下组件: PyTorch 1.6+ 火炬视觉0.7+ scikit图像 PyYAML 皮尔 麻木 OpenCVPython matplotlib 如何使用 从config.yaml文件中指定“ query_directory”和“ key_directory” 。 如果您使用“可视化”任务,则也要执行“ result_directory” 。 如果执行“可视化”
2022-09-20 23:30:00 791KB Python
1
A:西米喜欢健身 B:超超不爱健身,喜欢打游戏 step1:分词 A:西米/喜欢/健身 B:超超/不/喜欢/健身,喜欢/打/游戏 step2:列出两个句子的并集 西米/喜欢/健身/超超/不/打/游戏 step3:计算词频向量 A:[1,1,1,0,0,0,0] B:[0,1,1,1,1,1,1] step4:计算余弦值 余弦值越大,证明夹角越小,两个向量越相似。 step5:python代码实现 import jieba import jieba.analyse def words2vec(words1=None, words2=None): v1 = [] v2 = [] t
2022-09-20 23:21:19 38KB python 余弦 相似性
1
针对与测试数据分布相同的训练数据不足,相关领域中存在大量的、与测试数据分布相近的训练数据的场景,提出一种基于相似度学习的多源迁移学习算法(SL-MSTL).该算法在经典SVM分类模型的基础上提出一种新的迁移分类模型,增加对多源域与目标域之间的相似度学习,可以有效地利用各源域中的有用信息,提高目标域的分类效果.实验的结果表明了SL-MSTL 算法的有效性和实用性.
1
java相似度源码 化学开发套件 (CDK) 版权所有 :copyright: 1997-2020 CDK 开发团队 许可证:LGPL v2,参见 LICENSE.txt | | | | 介绍 CDK 是一个用于化学信息学和生物信息学的开源 Java 库。 主要特征: 分子和React价键表示。 读写文件格式:SMILES、SDF、InChI、Mol2、CML 等。 高效的分子处理算法:寻环、Kekulisation、芳香性。 坐标生成和渲染。 用于快速精确搜索的规范标识符。 子结构和智能模式搜索。 ECFP、Daylight、MACCS 和其他用于相似性搜索的指纹方法。 QSAR 描述符计算 安装 CDK 是一个旨在供其他程序使用的类库,它不会作为独立程序运行。 该库使用 Apache Maven 构建,目前需要 Java 1.7 或更高版本。 从项目的根运行以构建每个模块的 JAR 文件。 bundle/target/目录包含包含所有依赖项的主 JAR: $ mvn install 您还可以从 下载预先构建的库 JAR。 编译和运行代码时,在 Java 类路径中包含主 JAR: $ javac -cp
2022-09-17 15:02:36 28.42MB 系统开源
1