计算机系统结构:第5章 存储层次.docx
2022-06-14 14:00:40 91KB 计算机 互联网 文档
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的26倍。
1
存储砖石 电磁屡屡求分析3.1需求分析3.1.1性能需求分析3.1.2功能需求分析3.2数据流程图描述3.2.2系统分流程图3.3数据字典描述第四章 系统总体设计4.1模块设计4.1.1数构件统一设计
2022-01-09 20:39:24 125KB 存储
1