Strassen's的矩阵乘法算法的实现
1
稀疏矩阵的DIA/ELLPACK/COO/CSR/HYB表示形式,以及各表示形式下的稀疏矩阵乘法(稀疏大矩阵*矢量)的CUDA实现。对于矩阵中每一行稀疏元素个数较统一的情况,ELLPACK表示最佳,其次是HYB(ELL+COO)。关于稀疏矩阵的研究很多,这里列出的仅是凤毛麟角,有兴趣的朋友我们一起探讨。
2019-12-21 19:56:45 3.13MB 稀疏矩阵乘法 spmv CUDA
1
汇编语言实现矩阵乘法
2019-12-21 19:56:43 75KB 汇编
1
java、win32、pthread三种线程库均有 适合用来学习多线程操作的入门例程
2019-12-21 19:51:27 2KB java pthread win32 多线程
1
基于CUDA 的矩阵乘法和FFT 性能测试
2019-12-21 19:37:18 1.19MB CUDA 矩阵乘法 FFT
1
linux多线程程序实验,用不同线程完成一个矩阵乘法,以及子进程计算斐波那契数列,父进程输出结果
2019-12-21 19:30:25 235KB linux 线程 矩阵乘法 斐波那契数列
1
简单的矩阵乘法哈,线性代数偷懒用,VS2010以上编译运行通过
2019-12-21 19:21:29 2KB 矩阵乘法 C++
1
该程序基于 Boost 和 MPI 实现了Cannon 算法实现对矩阵得并行求积。
2019-12-21 18:57:43 78KB MPI Boost 矩阵 并行
1
strassen矩阵乘法的C代码 【问题描述】 从文件arr.in中读入一个m行k列的整数矩阵a和一个k行n列的整数矩阵b(1 < m, k, n < 200),在标准输出上输出这两个矩阵的乘积。 【输入形式】 输入文件arr.in中有m+k行,前m行是矩阵a的元素aij,后k行是矩阵b的元素bij (-3000 < aij, bij < 3000)。 【输出形式】 输出结果为m行,每行n个元素,按整数左对齐方式输出,每个元素占相同的位数,且各个元素之间空格的最少数量应等于1。 【输入样例】 1 0 0 1 1 1 1 1 【输出样例】 1 1 1 1
2019-12-21 18:54:38 9KB strassen 矩阵乘法 C
1
并行处理实验报告:基于MPI实现的矩阵乘法的性能分析。里面包含MPI实现代码,稠密矩阵以及稀疏矩阵的加速比分析
2019-12-21 18:49:06 112KB MPI 矩阵乘法 并行处理
1