基因组数据可用性的激增有望确定观察到的个体性状的遗传原因,并将其应用于发现表型的遗传根源等问题,无论是基因表达或代谢物浓度等分子表型,还是疾病等复杂表型。然而,这些数据集的规模不断扩大,以及相关算法的二次、三次或更高的缩放特性,带来了严重的计算挑战,需要使用领导力规模计算。在本文中,我们描述了一种执行向量相似性度量计算的新方法,适用于配备图形处理单元(GPU)或英特尔至强Phi处理器的并行系统。我们主要关注应用于全基因组关联研究(GWAS)和全表型关联研究(PheWAS)的比例相似性度量。我们描述了算法在加速处理器上的实现,用于消除对称性导致的冗余计算的方法,以及将计算有效映射到多节点并行系统的技术。 结果表明,在ORNL Titan系统上,每节点的高性能和并行可扩展性,每秒的元素比较速率超过5万亿(5×1015)。在一篇配套论文中,我们描述了用于计算比较基因组学应用的自定义相关系数的相应技术。
2022-02-09 18:01:59 3.98MB 基因组数据
基于Lire和Lucene的JavaFX GUI。 首先按内容对图像进行索引,然后在索引中搜索JPEG图像之间的相似性。 LIRE:http://www.semanticmetadata.net/lire/ LUCENE:http://lucene.apache.org/core/控制台模式,其输出易于解析器分析(安静模式)。
2021-12-30 14:34:35 3.3MB 开源软件
1
概括 比较两个音频文件或音频文件目录以评估它们的相似性。 可能已从另一个文件派生的文件被标记为匹配。 要运行该程序,请输入以下之一: ./audiocompare -f文件1 -f文件2 ./audiocompare -f文件1 -d目录1 ./audiocompare -d目录1 -f文件1 ./audiocompare -d目录1 -d目录2 “ -f”参数后面的参数必须是文件名,“-d”参数后面的参数必须是仅包含音频文件的目录。 输入文件必须是WAVE或MP3文件。 您可以列出相同的文件或目录两次。 如果发现错误,将打印适当的错误消息,并且程序可以继续执行。 如果比较了两个不匹配的文件,则匹配结果将打印为“ NO MATCH”,如果比较了两个匹配的文件,则显示为“ MATCH ...”,列出两个匹配的文件,并给出匹配分数。 该程序旨在在Linux上运行。 与OS X或
2021-12-29 11:28:31 192KB Python
1
社区发现 使用属性和结构相似性进行社区检测。 安装: pip install community_detect 依存关系: NetworkX Matplotlib 用法: Import: from community_detect import Community 初始化: com = Community(alpha_weight = 0.5) #You can add your own value for Alpha 职能: Main method: get_communities(Graph, #Your Graph Vertices, #List of Vertices Similarity Matrix, #Similarity
1
一种称为基于相关的动态时间扭曲 (CBDTW) 的新算法,它结合了基于 DTW 和 PCA 的相似性度量。 为了保持相关性,多元时间序列被分割,DTW 的局部差异函数源自 SPCA。 这些段是通过使用特殊的 PCA 相关成本通过自下而上的细分获得的。 我们的新技术符合两个数据库的要求,即 2004 年签名验证竞赛数据库和常用的 AUSLAN 数据集。 我们表明,在具有复杂相关结构的数据集的情况下,CBDTW 优于标准 SPCA 和最常用的基于欧几里德距离的多元 DTW。 该算法也描述在: J. Abonyi, F. Szeifert,用于识别模糊分类器的监督模糊聚类,模式识别快报,24(14) 2195-2207,2003 年 10 月
2021-12-25 17:04:27 8KB matlab
1
【学生研究课题】文档相似性检测系统(作业查重)-附件资源
2021-12-20 13:59:04 106B
1
介绍了现有协同过滤推荐的几种主要算法。它们对数据稀疏性问题都有一定的缓和作用。通过在数据集MovieLens上的实验,分析了各个算法在不同稀疏度下的推荐质量,为针对不同数据稀疏度的系统实现提供了可靠依据。
1
针对Criminisi算法在修复敦煌壁画时易出现错误填充、修复效率较低等问题,提出了一种基于序贯相似性和布谷鸟寻优算法结合的敦煌壁画修复方法。首先采用P-Laplace算子重新定义数据项,改进了优先权计算方法,避免了优先权频繁趋于0的问题;其次引入动态阈值序贯相似性检测算法进行匹配块的搜索,提高了壁画修复效率;为了使匹配块选择更加合理,再利用布谷鸟寻优算法确定最佳匹配块;最后通过迭代更新完成壁画修复。通过对敦煌壁画的修复实验表明,本文方法相比于同类比较算法,取得了较好的主客观修复效果,并且修复效率也得到了进一步提升。
2021-12-13 19:47:30 24.74MB 图像处理 壁画修复 序贯相似 布谷鸟寻
1
余弦相似性获取文章相似度的java实现,tf-idf算法实现
2021-12-13 17:16:48 71KB 文件相似度
1
改进DTW算法的心电信号相似性度量
2021-12-09 16:55:12 896KB 研究论文
1