CUDA数学函数 pow, sqrt, cbrt, hypot, exp, exp2, expm1, log, log2, log10, log1p, sin, cos, tan, asin, acos, atan, atan2, sinh, cosh, tanh, asinh, acosh, atanh, ceil, floor, trunc, round, etc. 只支持标量运算 许多函数有一个快速、较不精确的对应版本 以”__”为前缀,如__sin() 编译开关-use_fast_math强制生成该版本的目标码
2022-03-16 19:37:07 1.67MB cuda gpu
1
TIGRE:基于 GPU 的断层扫描迭代重建工具箱TIGRE 是一款用于大规模 3D 断层扫描重建的 GPU 加速软件,能够重建锥束计算机断层扫描和平行束计算机断层扫描等几何结构。 TIGRE 还包含大量用于图像重建的迭代方法,这些方法可以用更少的投影获​​得更好的图像。 包含的算法有: -FDK(反氡) -SART、OS-SART、SIRT(基于梯度下降) -CGLS(基于Krylov子空间) -ADS-POCS、OSC-POCS、B-ADS-POCS-β、SART-TV(总变异正则化) -MLEM(统计倒置) TIGRE 由巴斯大学和欧洲核子研究中心在修改后的 BSD 许可下发布,可供所有人使用和修改,作者确实鼓励人们为代码错误修复、新方法或任何可以帮助它变得更好的东西做出贡献! 访问 TIGRE 的 Github 页面了解更多信息。
2022-03-15 20:52:06 74.36MB matlab
1
本书介绍CPU和MATLAB的联合编程方法,包括首先介绍了不使用GPU实现MATLAB加速的方法;然后介绍了MATLAB和计算统一设备架(CUDA)配置通过分析进行zuiyou规划,以及利用c-mex进行CUDA编程;接着介绍了MATLAB与并行计算工具箱和运用CUDA加速函数库;zui后给出计算机图形实例和CUDA转换实例。本书还通过大量的实例、图示和代码,深入浅出地引导读者进入GPU的殿堂,易于读者理解和掌握。
2022-03-13 21:39:37 80.21MB matlab gpu
1
“ Could not load dynamic library ‘cudart64_100.dll’; dlerror: cudart64_100.dll not found”也看了许多的文章,都是讲tensorflow与cuda版本不匹配的问题, 只是将要重新安装匹配的文件,没有讲如何具体的解决这个问题。 而且我查了官网我的显卡及软件版本都是没有问题的,另外我尝试安装了CUDA 9.0 和10.0 版本, tensorflow 1.14 和 2.0 版本都不能解决这个问题。 最后没办法,从同学电脑里面复制了一个cudart64_100.dll文件, 实测 import tensorflow
2022-03-13 10:08:38 110KB 人工智能 tensroflow-gpu CUDA
1
带有OpenCV和CUDA的动手GPU加速计算机视觉 Packt发布的具有OpenCV和CUDA的动手GPU加速计算机视觉 这是Packt发布的的代码存储库。 **使用GPU实时处理复杂图像数据的有效技术** 这本书是关于什么的? 计算机视觉已在各行各业发生了革命性变化,OpenCV是计算机视觉中使用最广泛的工具,它能够以多种编程语言工作。 如今,在计算机视觉中,需要实时处理大图像,这对于OpenCV本身很难处理。 这就是CUDA发挥作用的地方,它使OpenCV可以利用功能强大的NVDIA GPU。 本书详细介绍了将OpenCV与CUDA集成以用于实际应用。 本书涵盖了以下令人兴奋的功能:了解如何从CUDA程序访问GPU设备的属性和功能 了解如何加快搜索和排序算法 检测图像中的线条和圆形等形状 使用算法探索对象跟踪和检测 在Jetson TX1中使用不同的视频分析技术处理视频 从P
2022-03-12 16:05:35 23.77MB C++
1
针对中央处理器(CPU)平台难以满足雷达信号处理实时性不足的问题,利用图形处理器(GPU)并行运算能力强的特点,在CPU-GPU异构系统中采用任务级、数据级和线程级并行策略,设计了基于多图形处理器的雷达信号处理并行算法.新算法根据图形处理器的访存机制进行优化设计,充分利用了图形处理器的并行计算资源.实验结果表明:基于4块图形处理器的多任务并行化计算平台与中央处理器平台相比较,加速比最大可达42.78 ,并且能够满足雷达信号处理的实时性要求.
2022-03-11 16:52:39 589KB 自然科学 论文
1
GPU高性能编程CUDA实战(CUDA_by_Example)的示例代码
2022-03-11 08:57:23 342KB 代码 cuda 课程
1
深度解析GPU的架构、系统软件、编程环境,以及CUDA编程各方面的知识和各种优化技术,包含大量实用代码示例,是并行程序开发领域最有影响力的著作之一。
2022-03-09 20:24:49 27.55MB CUDA
1
ArrayFire是一个通用库,可简化针对并行和大规模并行体系结构(包括CPU,GPU和其他硬件加速设备)的软件开发过程。 ArrayFire是ArrayFire的几个通用库,它简化了开发针对并行和大规模并行体系结构(包括CPU,GPU和其他硬件加速设备)的软件的过程。 ArrayFire的一些优势包括:易于使用,稳定,文档完善的API经过严格的性能和准确性测试商业上友好的开源许可ArrayFire的商业支持在arrayfire.com上了解更多好处ArrayFire为软件开发人员提供更多好处
2022-03-09 10:47:25 2.53MB C/C++ Concurrency
1