20210827-东吴证券-景嘉微-300474-军转民前“景”广阔,GPU“芯”辰大海.pdf
2021-08-28 09:06:40 1.64MB 行业
GPU高性能编程CUDA实战(CUDA By Example)》头文件_全书使用的,在163页通过多线程,使用多GPU的地方已完美调试,可运行通过。
2021-08-27 20:15:35 6KB book.h CUDA By
1
学习gpu的好资料,适合新手学习gpu的好资料,适合新手学习gpu的好资料,适合新手
2021-08-27 19:47:45 22.64MB gpu
1
Nori-Shaders-BE 这是适用于opengl es 3.0或更高版本的minecraft的着色器,此着色器具有一个并非所有着色器都具有的独特功能,并且基于物理纹理的渲染(PBR)是其自身的唯一性,但除此之外,着色器仅基于Minecraft的内置雾色,因此不确定的颜色是什么。 因为此着色器基于pbr,所以在这里我将告诉您如何创建它以及如何工作 让我们来看看...
2021-08-27 17:16:12 3.47MB GLSL
1
使用C#调用CUDA的DLL链接库实现GPU计算的一个小案例,具体步骤参考地址:http://go.boselor.com/fwlink?id=12
2021-08-27 15:06:08 17.64MB cuda
1
pytorch训练cifar100测试单GPU效率代码,用于测试GPU效率,基于开源https://github.com/weiaicunzai/pytorch-cifar100
2021-08-26 20:06:00 161.8MB PyTorch GPU
1
yolo5_gpu_class yolov5 C ++ GPU版本,速度70ms / frame 网络使用cuda加速 net.setPreferableBackend(dnn::DNN_BACKEND_CUDA); net.setPreferableTarget(dnn::DNN_TARGET_CUDA); 常规函数使用UMat加速 Mat uFunction(frame) { UMat uimg; Mat result; frame.copyto(uimg) ####process uimg like img canny(uimg) ####process uimg like img uimg.copyto(result) return result } mat->umat 1.5ms umat版本函数有很多会被加速5,6倍 umat-mat 1ms
2021-08-26 10:22:44 5KB C++
1
使用用于GPU的ELLPACK-R设计并行稀疏矩阵换位算法
2021-08-26 10:10:29 522KB 研究论文
1
稀疏矩阵矢量乘法(SpMV)在几乎所有科学计算中都是不可避免的,例如用于求解线性系统和特征值问题的迭代方法。 随着图形处理单元(GPU)的出现和发展,应该为SpMV构建高效的格式。 SpMV的性能主要由稀疏矩阵的存储格式决定。 基于JAD格式的思想,本文改进了ELLPACK-R格式,减少了经纱中不同线程之间的等待时间,并且在我们的实验结果中,速度提高了约1.5。 与其他格式(例如CSR,ELL,BiELL等)相比,我们的SpMV格式性能在测试矩阵的70%以上是最佳的。 我们提出了一种基于参数的方法来分析性能对不同格式的影响。 另外,构造了一个公式来计算计算次数和迭代次数。
2021-08-26 10:07:24 1.27MB 行业研究
1
GPU的cuda中文开发文档,适合于刚入门的初学者学习,
2021-08-26 09:50:19 2.13MB CUDA GPU
1