模拟了水面水波的反射与折射,有倒影 波光粼粼的水面
2022-05-27 14:07:43 246KB opengl gpu 水波折射 反射
1
GPU流水线脑图
2022-05-26 19:38:02 152KB GPU流水线
1
FFT-GPU-Accel Fast Fourier Transform Acceleration Algorithm. (Accelerated by CUDA) 简要介绍 基于FFT的蝶形公式,利用GPU的多核心优势,结合蝶形公式算法中同一层级的运算因子互不干扰的特点,对算法进行了并行化优化处理,加速效果十分显着。 在同一测试机器上,速度能达到Matlab(R2017b)的数十倍。 核心算法 基于快速傅里叶变换的蝶形公式,对于N元待转换信号,蝶形公式为logN层级的子运算,每层的子运算中,运算因子在同层中互不干扰,因此只要利用好CUDA的__syncthreads()函数,在此基础上便可进一步利用GPU的单个线程来纵向处理每一个运算因子。 优化处理 注意到蝶形公式中的旋转因子Wn^k大量重复出现,因此必须要对旋转因子做好预处理工作。由于预处理数据是静态的,故可考虑将其放入纹理单元以加
2022-05-25 22:22:20 242KB C++
1
自己在jetpack5.0.1版本的nx上build的onnx版本,不是正式版本,可能会在一些环境下出问题。理论上说jetson系列应该都可以安装运行,前提是cuda11.4(使用tensorrt的话需要tensorrt8.4)
2022-05-25 11:07:11 25.01MB linux 源码软件 TensorRT Onnxruntime-gpu
1
NVIDIA 的openCL 教程 介绍了CUDA 和 OpenCL的区别
2022-05-24 19:26:36 271KB NVIDIA OpenCL CUDA GPU
1
用来查看你的显卡(无论是独立显示还是集成显卡)是否支持OpenGL,如果支持,则显示究竟是什么版本。并可以显示一个三维图形进行测试。
2022-05-24 16:57:41 4.11MB OpenGL OpenCL GPU 显卡
1
一个老程序猿要走Pytorch的新路,先搭建一个运行调试环境,踩坑若干若干,那滋味就是一个字=太爽!分享给同路的小伙伴,一些学习成长吧! 涉及的内容包括: 1.更新显卡驱动GTX1070 CUDA Version:11.6; 2.从官网下载对应版本的 CUDA Toolkit Archive | NVIDIA Developer 3.安装NVIDIA cuDNN 4.安装Anaconda3 5.创建Pytorch_GPU运行的虚拟环境 6.使用清华镜像快速安装PytorchGPU版本 7.IDE安装Pycharm,链接Anaconda环境解释器 8.验证
2022-05-24 09:08:32 535KB pytorch gpu cuda pycharm
1
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。本书首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA c的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA c中每个功能的适用场合,并编写出高性能的CUDA软件。
2022-05-23 14:31:43 337KB cuda gpu
1
腾讯数字生态大会-GPU 加速的 Spark 3.pdf
2022-05-22 14:07:07 2.55MB
常用的查看显卡的软件GPU-Z,和之前的版本相比有了很大的改进,但是响应速度依然有点慢。用来一般性的查看显卡信息已经足够了。
2022-05-22 05:42:31 6.59MB 显卡 软件
1