集群是当今高性能计算领域的重要发展方向,随着高速互联网络硬件的发展,低效的通信方式成为制约集群整体性能的关键因素。高效的通信机制能够更好地利用互联网络硬件为高性能计算提供更高性能的通信支持,通信性能通常都远高于传统的IP协议。
2021-05-27 10:56:56 64KB 集群 高性能计算 通信机制
1
cuda程序示例代码,包括CUDA入门代码,CUDA进阶代码和CUDA实用代码,为《并行计算教程(第1版)》的配套代码
2021-05-25 09:01:13 22KB 并行计算 CUDA 多线程 高性能计算
1
这是一本很经典的结合生物信息学与计算机的书,想深研生物信息与计算机交叉方向的学生可以看一看
2021-05-24 11:57:57 52.82MB 生物信息 算法
1
MIC:架构代号,Intel Many Integrated Core的英文缩写。本书介绍了使用MIC进行通用计算所需要了解的硬件架构、语法、程序优化技巧等知识,是进行MIC高性能与通用计算程序开发的入门教材和参考书。
2021-04-18 17:55:42 46.65MB MIC HPC 多核 众核
1
GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现
2021-04-14 20:30:20 487KB GPU
1
微软高性能计算服务器 step by step 作者:徐明强
2021-03-25 17:50:49 17.65MB 高性能计算
1
Fundamentals of Memory Subsystem Design for HPC and AI
2021-03-23 14:09:40 2.73MB 高性能计算
1
高性能计算(HPC)详解
2021-03-16 21:04:38 444KB 高性能计算 HPC
1
用cuda实现的3×3中值滤波,排序算法为二分法,利用共享内存,巧妙加速,算法执行效率非常高。 下载后带入数据直接用。
2021-03-02 20:02:23 3KB cuda 中值滤波 并行计算
包含一些内容 GPU与加速计算 MPI编程 OpenMP编程 并行程序性能优化 并行程序模型 并行和优化案例 高性能计算概述
2021-03-02 14:49:24 52.39MB GPU加速 并行计算 高性能计算
1