《GPU高性能计算之CUDA》实例

上传者: csrookie | 上传时间: 2022-05-05 17:03:47 | 文件大小: 10.5MB | 文件类型: RAR
《GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。

文件下载

资源详情

[{"title":"( 31 个子文件 10.5MB ) 《GPU高性能计算之CUDA》实例","children":[{"title":"《GPU高性能计算之CUDA》实例","children":[{"title":"matrixAssign.zip <span style='color:#111;'> 11.97KB </span>","children":null,"spread":false},{"title":"reduction.zip <span style='color:#111;'> 7.32MB </span>","children":null,"spread":false},{"title":"matrixMul_Berkeley.zip <span style='color:#111;'> 7.04KB </span>","children":null,"spread":false},{"title":"timing.zip <span style='color:#111;'> 9.35KB </span>","children":null,"spread":false},{"title":"VectorAddDrv.zip <span style='color:#111;'> 8.83KB </span>","children":null,"spread":false},{"title":"asyncAPI.zip <span style='color:#111;'> 6.14KB </span>","children":null,"spread":false},{"title":"simpleTexture.zip <span style='color:#111;'> 638.04KB </span>","children":null,"spread":false},{"title":"scanLargeArray.zip <span style='color:#111;'> 12.27KB </span>","children":null,"spread":false},{"title":"scan.zip <span style='color:#111;'> 528.46KB </span>","children":null,"spread":false},{"title":"Bitonic.zip <span style='color:#111;'> 9.60KB </span>","children":null,"spread":false},{"title":"simpleD3D10.zip <span style='color:#111;'> 94.69KB </span>","children":null,"spread":false},{"title":"simpleStreams.zip <span style='color:#111;'> 7.75KB </span>","children":null,"spread":false},{"title":"simpleCUFFT.zip <span style='color:#111;'> 7.09KB </span>","children":null,"spread":false},{"title":"simpleTextureDrv.zip <span style='color:#111;'> 648.73KB </span>","children":null,"spread":false},{"title":"cudaMPI.zip <span style='color:#111;'> 211.36KB </span>","children":null,"spread":false},{"title":"GPU高性能计算之CUDA_书中实例_All.rar <span style='color:#111;'> 4.67MB </span>","children":null,"spread":false},{"title":"threadMigration.zip <span style='color:#111;'> 8.73KB </span>","children":null,"spread":false},{"title":"histKernel.zip <span style='color:#111;'> 11.16KB </span>","children":null,"spread":false},{"title":"cudaOpenMP.zip <span style='color:#111;'> 7.21KB </span>","children":null,"spread":false},{"title":"simpleD3D9.zip <span style='color:#111;'> 356.92KB </span>","children":null,"spread":false},{"title":"simpleCUBLAS.zip <span style='color:#111;'> 6.74KB </span>","children":null,"spread":false},{"title":"simpleMultiGPU.zip <span style='color:#111;'> 8.76KB </span>","children":null,"spread":false},{"title":"simpleGL.zip <span style='color:#111;'> 289.17KB </span>","children":null,"spread":false},{"title":"sortingNetworks.zip <span style='color:#111;'> 15.11KB </span>","children":null,"spread":false},{"title":"bandwidthTest.zip <span style='color:#111;'> 8.33KB </span>","children":null,"spread":false},{"title":"matrixMul.zip <span style='color:#111;'> 10.98KB </span>","children":null,"spread":false},{"title":"ACsearch_DPPcompact_with_driver.zip <span style='color:#111;'> 2.50MB </span>","children":null,"spread":false},{"title":"transpose.zip <span style='color:#111;'> 10.19KB </span>","children":null,"spread":false},{"title":"deviceQuery.zip <span style='color:#111;'> 6.11KB </span>","children":null,"spread":false},{"title":"VectorAdd.zip <span style='color:#111;'> 7.71KB </span>","children":null,"spread":false},{"title":"transposeDiagonal.zip <span style='color:#111;'> 9.29KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

  • qcyfred :
    非常好,可以和书一起看。但是CUDA只能用在N卡上,A卡不能用……
    2016-06-13
  • v2q1sjsj :
    还行吧 入门级的
    2015-07-11
  • kaixingua :
    正在研究GPU高性能计算,参考参考
    2015-05-29
  • tansipinzhu :
    好多啊,应该很实用
    2015-05-13
  • qq349615260 :
    非常不错,学习了
    2014-10-15

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明