GPU内存和线程等关系 Thread 线程私有 Local Memory Block 每个block Shared Memory . . . . . . Kernel 0 每个设备共有的 Global Memory Kernel 1 Sequential Kernels 设备(GPU0) 存储器 设备(GPU1) 存储器 主机端 存储器 cudaMemcpy()
2021-10-20 19:53:58 1.06MB CUDA编程模型
1