包含全部《GPU高性能计算之CUDA》一书的源代码,值得一看。
2022-03-17 17:45:23 4.68MB GPU CUDA 张舒 源代码
1
从过境车辆图片或视频中提取7014、4204、1223、1225、4010、6038等交通违法。 10万过境车可提取约2000违法车辆,使用英伟达独立显卡,10万记录一小时左右识别完。 识别完成后,软件会把提取到的图片按违法代码分类存在不同的文件夹。 后期用违法录入软件一键导入即可上传到交警集成指挥平台。 注意:电脑要配备英伟达显卡,并安装最新显卡驱动。
2022-03-17 13:16:30 312.72MB 人工智能 图像识别 计算机视觉
1
CUDA数学函数 pow, sqrt, cbrt, hypot, exp, exp2, expm1, log, log2, log10, log1p, sin, cos, tan, asin, acos, atan, atan2, sinh, cosh, tanh, asinh, acosh, atanh, ceil, floor, trunc, round, etc. 只支持标量运算 许多函数有一个快速、较不精确的对应版本 以”__”为前缀,如__sin() 编译开关-use_fast_math强制生成该版本的目标码
2022-03-16 19:37:07 1.67MB cuda gpu
1
TIGRE:基于 GPU 的断层扫描迭代重建工具箱TIGRE 是一款用于大规模 3D 断层扫描重建的 GPU 加速软件,能够重建锥束计算机断层扫描和平行束计算机断层扫描等几何结构。 TIGRE 还包含大量用于图像重建的迭代方法,这些方法可以用更少的投影获​​得更好的图像。 包含的算法有: -FDK(反氡) -SART、OS-SART、SIRT(基于梯度下降) -CGLS(基于Krylov子空间) -ADS-POCS、OSC-POCS、B-ADS-POCS-β、SART-TV(总变异正则化) -MLEM(统计倒置) TIGRE 由巴斯大学和欧洲核子研究中心在修改后的 BSD 许可下发布,可供所有人使用和修改,作者确实鼓励人们为代码错误修复、新方法或任何可以帮助它变得更好的东西做出贡献! 访问 TIGRE 的 Github 页面了解更多信息。
2022-03-15 20:52:06 74.36MB matlab
1
本书介绍CPU和MATLAB的联合编程方法,包括首先介绍了不使用GPU实现MATLAB加速的方法;然后介绍了MATLAB和计算统一设备架(CUDA)配置通过分析进行zuiyou规划,以及利用c-mex进行CUDA编程;接着介绍了MATLAB与并行计算工具箱和运用CUDA加速函数库;zui后给出计算机图形实例和CUDA转换实例。本书还通过大量的实例、图示和代码,深入浅出地引导读者进入GPU的殿堂,易于读者理解和掌握。
2022-03-13 21:39:37 80.21MB matlab gpu
1
“ Could not load dynamic library ‘cudart64_100.dll’; dlerror: cudart64_100.dll not found”也看了许多的文章,都是讲tensorflow与cuda版本不匹配的问题, 只是将要重新安装匹配的文件,没有讲如何具体的解决这个问题。 而且我查了官网我的显卡及软件版本都是没有问题的,另外我尝试安装了CUDA 9.0 和10.0 版本, tensorflow 1.14 和 2.0 版本都不能解决这个问题。 最后没办法,从同学电脑里面复制了一个cudart64_100.dll文件, 实测 import tensorflow
2022-03-13 10:08:38 110KB 人工智能 tensroflow-gpu CUDA
1
带有OpenCV和CUDA的动手GPU加速计算机视觉 Packt发布的具有OpenCV和CUDA的动手GPU加速计算机视觉 这是Packt发布的的代码存储库。 **使用GPU实时处理复杂图像数据的有效技术** 这本书是关于什么的? 计算机视觉已在各行各业发生了革命性变化,OpenCV是计算机视觉中使用最广泛的工具,它能够以多种编程语言工作。 如今,在计算机视觉中,需要实时处理大图像,这对于OpenCV本身很难处理。 这就是CUDA发挥作用的地方,它使OpenCV可以利用功能强大的NVDIA GPU。 本书详细介绍了将OpenCV与CUDA集成以用于实际应用。 本书涵盖了以下令人兴奋的功能:了解如何从CUDA程序访问GPU设备的属性和功能 了解如何加快搜索和排序算法 检测图像中的线条和圆形等形状 使用算法探索对象跟踪和检测 在Jetson TX1中使用不同的视频分析技术处理视频 从P
2022-03-12 16:05:35 23.77MB C++
1
针对中央处理器(CPU)平台难以满足雷达信号处理实时性不足的问题,利用图形处理器(GPU)并行运算能力强的特点,在CPU-GPU异构系统中采用任务级、数据级和线程级并行策略,设计了基于多图形处理器的雷达信号处理并行算法.新算法根据图形处理器的访存机制进行优化设计,充分利用了图形处理器的并行计算资源.实验结果表明:基于4块图形处理器的多任务并行化计算平台与中央处理器平台相比较,加速比最大可达42.78 ,并且能够满足雷达信号处理的实时性要求.
2022-03-11 16:52:39 589KB 自然科学 论文
1
GPU高性能编程CUDA实战(CUDA_by_Example)的示例代码
2022-03-11 08:57:23 342KB 代码 cuda 课程
1