##稀疏矩阵向量乘法与 MPI 并行 ###Design 使用 MPI 并行化稀疏矩阵向量乘法: 在步骤 1 中使用一维行分解读取文件并将数据分发到所有处理器,这需要 O(n) 然后 O(nnz) 其中 n 是行数,nnz 是矩阵。 矩阵 A 数据以 CSR 格式读入和存储,其中包括三个数组:行指针、非零的列索引和矩阵值。 步骤 1 还涉及使用 MPI Bcast 将数据分发到 p 个处理器。 每个进程准备使用 prepareRemoteVec 函数获取它需要的非本地 Vector 元素。 在这里,它遍历矩阵的本地列索引并检查所需的远程向量条目是什么,然后调整本地向量数据数组 (vSize + numRemoteVec) 的大小,以在数组末尾保存来自其他处理器的这些附加远程向量条目。 最后,我们需要重新索引本地列索引数组(之前指向全局向量数据索引)。 我们遍历本地列索引数组,并让它们指
2021-09-07 11:14:39 10KB C
1
并行算法设计与分析(第三版) 是学习入门并行算法的入门书籍
2021-09-06 23:02:41 19.52MB 并行算法 设计与分析
1
Linux下多线程并行处理在HT-7极向场控制系统的应用.pdf
2021-09-06 22:00:54 252KB Linux 操作系统 系统开发 参考文献
在流行的加法器体系结构中,最快的加法器体系结构之一。 加法器是将二进制数字加在一起的数字逻辑设备。 它们通常用作算术逻辑单元的组件,而算术逻辑单元本身就是中央处理单元的组件。 结果,任何具有微控制器或CPU的电子设备,例如智能恒温器,数字闹钟,数字手表和数字浴室秤等,都使用加法器电路。 在这项工作中,我们提出了一种8位混合进位选择加法器架构。 它采用了使用Kogge石头加法器结构,Brent Kung加法器结构,Han Carlson加法器结构和Ladner Fischer加法器结构的并行前缀加法。 它还使用Binary to Excess 1代码转换器以及并行前缀加法器。 使用Verilog代码完成建议设计的确认,并使用Xilinx ISE 14.7进行仿真,并使用Cadence软件计算功率,面积和延迟结果。 与现有传统加法器体系结构的比较证明了其更好的质量。 实验分析表明,在速度,面积和功率方面,推荐的混合式随身加法器具有三倍的优势。
2021-09-06 21:01:29 786KB Parallel Prefix Adder Carry
1
电子书,论文,并行遗传算法研究综述 电子书,论文,并行遗传算法研究综述 电子书,论文,并行遗传算法研究综述
2021-09-06 15:32:41 399KB 并行遗传算法研究综述
1
本人亲自做的教程,亲测了好几次,每次都成功!注意: 本教程要在 root 用户下安装
2021-09-06 14:28:30 351KB lammps 安装 成功
1
windows系统下lammps并行安装,一般性分子模拟软件。 兼容当前大多数的势能模型,编程水平高,计算效率高。可以 模拟软材料和固体物理系统。
2021-09-06 14:22:46 494KB windows lammps
1
多变量模糊系统控制设计及其在并行混合电动汽车中的应用(英文).pdf
主要描述了对于大规模的矩阵运算在CUDA平台上的实现原理
2021-09-04 22:29:02 79KB CUDA 矩阵乘法 并行
1
行业分类-电子政务-一种多量程电流测量并行显示装置.zip