Redshift是世界上第一个完全基于GPU加速的有偏差3D渲染器。渲染速度提升百倍!核心设计可以有效的渲染非常大的场景的几何和纹理,远远超过可用显存。非常适合动漫、影视特效、广告、建筑设计等行业使用。
2022-06-08 19:11:30 63.69MB 软件/插件 渲染器
项目开始帮助实现 跨常见 ML 瓶颈组件的性能可观察性和诊断 针对常见问题的可行建议 外部系统级分析工具的集成 与流行的可视化平台和分析管道集成 一个核心组件是 libkineto,它是一个分析库,特别关注低开销 GPU 时间线跟踪。 PyTorch Profiler TensorBoard 插件提供强大而直观的分析结果可视化,以及可操作的建议,是体验新 PyTorch Profiler 的最佳方式。
2022-06-03 09:07:32 7.92MB html
基于深度学习的艺术画生成系统,包含教程以、数据集及算法源码可以配置GPU训练。这个模型参数已经设置好可以直接使用
2022-05-31 09:12:09 7.09MB 深度学习 算法 源码软件 人工智能
GPU性能 GPU性能优化存储库
2022-05-30 17:21:57 332KB Fortran
1
很多人都知道opencv 有gpu模块支持cuda技术,可以用来加速,opencv社区也在不断完善,但如何使用呢,下载的都是不带gpu模块的,如何使用opencv的gpu模块呢?不用担心,本文将为你讲述
2022-05-29 22:02:43 1.35MB opencv gpu模块 opencv2.4.1 vs
1
本文实例讲述了Python基于pyCUDA实现GPU加速并行计算功能。分享给大家供大家参考,具体如下: Nvidia的CUDA 架构为我们提供了一种便捷的方式来直接操纵GPU 并进行编程,但是基于 C语言的CUDA实现较为复杂,开发周期较长。而python 作为一门广泛使用的语言,具有 简单易学、语法简单、开发迅速等优点。作为第四种CUDA支持语言,相信python一定会 在高性能计算上有杰出的贡献–pyCUDA。 pyCUDA特点 CUDA完全的python实现 编码更为灵活、迅速、自适应调节代码 更好的鲁棒性,自动管理目标生命周期和错误检测 包含易用的工具包,包括基于GP
2022-05-27 23:10:41 83KB python python函数 python实例
1
模拟了水面水波的反射与折射,有倒影 波光粼粼的水面
2022-05-27 14:07:43 246KB opengl gpu 水波折射 反射
1
GPU流水线脑图
2022-05-26 19:38:02 152KB GPU流水线
1
FFT-GPU-Accel Fast Fourier Transform Acceleration Algorithm. (Accelerated by CUDA) 简要介绍 基于FFT的蝶形公式,利用GPU的多核心优势,结合蝶形公式算法中同一层级的运算因子互不干扰的特点,对算法进行了并行化优化处理,加速效果十分显着。 在同一测试机器上,速度能达到Matlab(R2017b)的数十倍。 核心算法 基于快速傅里叶变换的蝶形公式,对于N元待转换信号,蝶形公式为logN层级的子运算,每层的子运算中,运算因子在同层中互不干扰,因此只要利用好CUDA的__syncthreads()函数,在此基础上便可进一步利用GPU的单个线程来纵向处理每一个运算因子。 优化处理 注意到蝶形公式中的旋转因子Wn^k大量重复出现,因此必须要对旋转因子做好预处理工作。由于预处理数据是静态的,故可考虑将其放入纹理单元以加
2022-05-25 22:22:20 242KB C++
1
自己在jetpack5.0.1版本的nx上build的onnx版本,不是正式版本,可能会在一些环境下出问题。理论上说jetson系列应该都可以安装运行,前提是cuda11.4(使用tensorrt的话需要tensorrt8.4)
2022-05-25 11:07:11 25.01MB linux 源码软件 TensorRT Onnxruntime-gpu
1