GPU性能 GPU性能优化存储库
2022-05-30 17:21:57 332KB Fortran
1
很多人都知道opencv 有gpu模块支持cuda技术,可以用来加速,opencv社区也在不断完善,但如何使用呢,下载的都是不带gpu模块的,如何使用opencv的gpu模块呢?不用担心,本文将为你讲述
2022-05-29 22:02:43 1.35MB opencv gpu模块 opencv2.4.1 vs
1
本文实例讲述了Python基于pyCUDA实现GPU加速并行计算功能。分享给大家供大家参考,具体如下: Nvidia的CUDA 架构为我们提供了一种便捷的方式来直接操纵GPU 并进行编程,但是基于 C语言的CUDA实现较为复杂,开发周期较长。而python 作为一门广泛使用的语言,具有 简单易学、语法简单、开发迅速等优点。作为第四种CUDA支持语言,相信python一定会 在高性能计算上有杰出的贡献–pyCUDA。 pyCUDA特点 CUDA完全的python实现 编码更为灵活、迅速、自适应调节代码 更好的鲁棒性,自动管理目标生命周期和错误检测 包含易用的工具包,包括基于GP
2022-05-27 23:10:41 83KB python python函数 python实例
1
模拟了水面水波的反射与折射,有倒影 波光粼粼的水面
2022-05-27 14:07:43 246KB opengl gpu 水波折射 反射
1
GPU流水线脑图
2022-05-26 19:38:02 152KB GPU流水线
1
FFT-GPU-Accel Fast Fourier Transform Acceleration Algorithm. (Accelerated by CUDA) 简要介绍 基于FFT的蝶形公式,利用GPU的多核心优势,结合蝶形公式算法中同一层级的运算因子互不干扰的特点,对算法进行了并行化优化处理,加速效果十分显着。 在同一测试机器上,速度能达到Matlab(R2017b)的数十倍。 核心算法 基于快速傅里叶变换的蝶形公式,对于N元待转换信号,蝶形公式为logN层级的子运算,每层的子运算中,运算因子在同层中互不干扰,因此只要利用好CUDA的__syncthreads()函数,在此基础上便可进一步利用GPU的单个线程来纵向处理每一个运算因子。 优化处理 注意到蝶形公式中的旋转因子Wn^k大量重复出现,因此必须要对旋转因子做好预处理工作。由于预处理数据是静态的,故可考虑将其放入纹理单元以加
2022-05-25 22:22:20 242KB C++
1
自己在jetpack5.0.1版本的nx上build的onnx版本,不是正式版本,可能会在一些环境下出问题。理论上说jetson系列应该都可以安装运行,前提是cuda11.4(使用tensorrt的话需要tensorrt8.4)
2022-05-25 11:07:11 25.01MB linux 源码软件 TensorRT Onnxruntime-gpu
1
NVIDIA 的openCL 教程 介绍了CUDA 和 OpenCL的区别
2022-05-24 19:26:36 271KB NVIDIA OpenCL CUDA GPU
1
用来查看你的显卡(无论是独立显示还是集成显卡)是否支持OpenGL,如果支持,则显示究竟是什么版本。并可以显示一个三维图形进行测试。
2022-05-24 16:57:41 4.11MB OpenGL OpenCL GPU 显卡
1
一个老程序猿要走Pytorch的新路,先搭建一个运行调试环境,踩坑若干若干,那滋味就是一个字=太爽!分享给同路的小伙伴,一些学习成长吧! 涉及的内容包括: 1.更新显卡驱动GTX1070 CUDA Version:11.6; 2.从官网下载对应版本的 CUDA Toolkit Archive | NVIDIA Developer 3.安装NVIDIA cuDNN 4.安装Anaconda3 5.创建Pytorch_GPU运行的虚拟环境 6.使用清华镜像快速安装PytorchGPU版本 7.IDE安装Pycharm,链接Anaconda环境解释器 8.验证
2022-05-24 09:08:32 535KB pytorch gpu cuda pycharm
1