mfem:轻量,通用,可扩展的C ++库,用于有限元方法
1
有向无环图的并行DFS 根据, 是DFS遍历的并行算法的C ++实现。 该算法下的思想克服了基于DFS的标准标记方法的并行实现问题。 这是因为DFS在边缘访问和某些全局变量的使用方面要求严格的顺序,这在需要并行处理时代表了很大的局限性。 该算法为有向无环图(DAG)的DFS遍历提供了不超过3次BFS访问的有效解决方案,从而可以找到DAG节点之间的前序,后序和父级关系。 BFS的首次访问旨在将DAG转换为DT(图B); 下次访问是在DT上完成的,它的作用是为每个节点找到子树的大小,子树的大小定义为可从其到达的节点数加上自身(图C); 进行第三次访问时,可以获取根据DFS访问顺序先前应访问的节点,查看当前节点的先前同级和父级先前同级的子树大小(图D)。 从先前计算出的值开始,我们获得后顺序和前顺序(在此实现中未计算后顺序,但是只需对代码进行很小的更改即可轻松完成)(图E)。 请注意
2023-04-07 18:52:11 71KB cpp graph async parallel-computing
1
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
2023-02-19 08:11:13 16.57MB CUDA
1
并行计算的经典书籍。有几个链接下载下来后发现打开后都无法显示,索性自己找一个供大家使用。
2023-02-02 10:54:59 6MB Parallel Computing,并行计算
1
Introduction to Parallel Computing From Algorithms toProgramming
2022-12-17 11:04:42 8.02MB EDA Algoritms
1
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
2022-12-15 20:03:48 16.58MB GPUS CUDA
1
BLAST(基本局部比对搜索工具)是一种局部比对算法,具有很高的准确度,被广泛使用。 它可以在保持高精度的同时减少程序的运行时间,但是在比较大型基因数据集时却存在性能瓶颈和低效率。 因此,提出了一种基于Spark的分布式并行方法Spark_BLAST。 该方法利用Spark内存计算来识别和划分任务,并实现了BLAST算法的分布式并行计算。 最后,该方法在5个节点的Spark集群上实现。 与单机比较表明,Spark .cluster的加速可以达到约4,而不会改变比较结果的准确性。 该方法为生物信息学提供了一种有效的比对方法。
2022-11-02 15:55:19 732KB Spark Parallel computing Bioinformatics
1
http://www.hsafoundation.com/standards/ The contents of this document are provided in connection with the HSA Foundation specifications. This specification is protected by copyright laws and contains material proprietary to the HSA Foundation. It or any components may not be reproduced, republished, distributed, transmitted, displayed, broadcast or otherwise exploited in any manner without the express prior written permission of HSA Foundation. You may use this specification for implementing the functionality therein, without altering or removing any trademark, copyright or other notice from the specification, but the receipt or possession of this specification does not convey any rights to reproduce, disclose, or distribute its contents, or to manufacture, use, or sell anything that it may describe, in whole or in part.
2022-10-31 20:39:44 8.15MB HSA Parallel Computing
1
Kokkos:核心库 Kokkos Core 在 C++ 中实现了一个编程模型,用于编写针对所有主要 HPC 平台的高性能便携式应用程序。 为此,它为代码的并行执行和数据管理提供了抽象。 Kokkos 旨在针对具有 N 级内存层次结构和多种类型执行资源的复杂节点架构。 它目前可以使用 CUDA、HPX、OpenMP 和 Pthreads 作为后端编程模型,以及其他几个正在开发的后端。 Kokkos Core 是 Kokkos C++ 性能可移植性编程生态系统的一部分,该生态系统还提供数学内核 ( ),以及分析和调试工具 ( )。 了解 Kokkos 可以在 Wiki 上找到编程指南,API 参考正在开发中。 如有问题,请在 Slack 上找到我们: : 或打开 github 问题。 对于非公开问题,请发送电子邮件至 crtrott(at)sandia.gov 可以在下找到包含
1
并行计算机如何成功应用于大规模科学计算的清晰说明。 研究与将来的超级计算机有关的细粒度并行性问题,其中特别着重于超立方体体系结构。
2022-10-16 21:03:15 98B 计算机科学
1