视频深度图——CS179项目 使用 Python 和 CUDA 生成实时视频深度图。 运行说明: 在项目根目录下; python scripts/run_disparity.py NOTE: stereo-video has to be located in $PROJECTROOT/videos/ subdirectory video must also be a juxtapose stereo video pair 依赖项: 可 Pip 的依赖项在requirements.txt中列出。 然而,这个项目也依赖于 OpenCV。 使用 Python3.4,我们选择使用 OpenCV 3.0.0-rc1,在 Ubuntu 15.04 (x64) 上从源代码编译。 安装脚本 opencv.sh 位于misc/ 。 脚本来自 注意:我们建议使用
2022-04-01 16:20:27 13KB Cuda
1
有时候会碰到cuda报错,OSError: libcudart.so.10.0: cannot open shared object file: No such file 原因是cuda动态链接库没有链接上。 解决方法如下: cuda10.0: sudo ldconfig /usr/local/cuda-10.0/lib64 cuda9.0: sudo ldconfig /usr/local/cuda-9.0/lib64/ 说明 ldconfig 命令的用途,主要是在默认搜寻目录(/lib和/usr/lib)以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态
2022-03-30 19:54:36 67KB .so ann ar
1
《GPU高性能运算之CUDA》是进行GPU通用计算程序开发的入门教材和参考书。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。 《GPU高性能运算之CUDA》可作为CUDA的学习入门和编程参考书,对于学习高性能的同学是不可多得的教材。
2022-03-28 14:46:12 14.21MB GPU编程 cuda
1
基础条件: Win10 + GTX 1060 安装显卡驱动 首先安装 显卡驱动: https://www.nvidia.cn/Download/index.aspx?lang=cn 按自己的GPU型号和操作系统去选择驱动版本,下载类型选择 Studio 下载后的驱动文件: 直接运行即可。 安装完成后,nvidia-smi即可查看GPU信息 安装CUDA 接下来安装 CUDA,试了9.0、9.2版本在安装时都会报一些错,大致是说驱动版本高而CUDA版本低,所以直接安装 10.2 主要参考了这篇文章: https://blog.csdn.net/bingo_liu/article/deta
2022-03-20 22:39:03 833KB cuda cudnn ens
1
主要介绍了ubuntu16.04安装多个版本的CUDA的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
1
包含全部《GPU高性能计算之CUDA》一书的源代码,值得一看。
2022-03-17 17:45:23 4.68MB GPU CUDA 张舒 源代码
1
CUDA数学函数 pow, sqrt, cbrt, hypot, exp, exp2, expm1, log, log2, log10, log1p, sin, cos, tan, asin, acos, atan, atan2, sinh, cosh, tanh, asinh, acosh, atanh, ceil, floor, trunc, round, etc. 只支持标量运算 许多函数有一个快速、较不精确的对应版本 以”__”为前缀,如__sin() 编译开关-use_fast_math强制生成该版本的目标码
2022-03-16 19:37:07 1.67MB cuda gpu
1
基于CUDA官方文件翻译,包括cuda编程模型、编程接口、硬件实现、性能指南、C语言扩展、数学函数、纹理获取、计算能力、驱动API等获取等介绍。
2022-03-16 18:10:37 1.93MB Cuda 编程指南
1
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的26倍。
1