winograd 算 法 的 代 码
2023-04-09 16:12:55 210KB CNN winograd
1
为了提高半经典分子动力学模拟中矩阵乘法效率, 通过一种稀疏矩阵分解方法化简矩阵乘法, 基于OpenMP实现矩阵相乘的Winograd并行算法。该算法将Winograd算法中各部分依次采用OpenMP并行计算, 降低了数据通信。在16核服务器上测试表明, 该方法能够显著提高半经典分子动力学模拟中矩阵乘法效率, 并行加速比能够达到9. 47, 并具有良好的可扩展性, 为大分子体系的模拟提供了可能。
2022-06-01 14:05:21 471KB 工程技术 论文
1
本IP核由Xilinx HLS高层次综合语言设计,采用Winograd算法降低卷积计算量,支持任意大小为3x3的、步长为1或2的卷积运算。C仿真,C/RTL协同仿真均已通过,并在xc7z020clg400-2开发板上上板通过测试。压缩包内包含HLS工程、以及SDK上板测试的代码
我们要讨论的第一种精简必要乘法数量的算法就是Winograd DFT算法。Winograd DFT算法是Rader算法(是将DFT转换成循环卷积)与我们在前面实现快速运行FIR滤波器时使用过的Winograd[85]短卷积算法的结合。   因而长度被限制在质数或质数的幂范围内。表简要的给出了算法操作的必要数量。   表 带有实输入的Winograd DFT的效果表   下面N=5的示例详细地说明了构造Winograd DFT算法的步骤。   例 N=5的Winograd DFT算法   在由[5]给出的Rader算法的一个表达式中,用X[0]代替x[0]的形式如下:   如
2021-12-23 17:18:49 128KB Winograd DFT算法 其它
1
Coppersmith-Winograd-Algorithm 尝试为Coppersmith Winograd算法创建关于NXN阵列的算法
2021-04-18 13:43:13 12KB
1