为方便国内Windows用户下载安装gpu版的torch1.7.1和torchvision0.8.2,现上传从官网下载的.whl安装包资源至我们广博的C站~(这部分是torchvision)
2022-04-20 12:05:19 1.43MB windows python pip torchvision
1
Fundamentals of Computer Graphics (3rd Edition)第三版,计算机图形学的基础课程,很多大学的教材
2022-04-19 20:41:40 20.13MB gpu ComputerGraphics
1
来自AMD的资深工程师谢海波从CPU/GPU的数据传输、OpenCL的运行时开销、APU架构等方面讲解了HSA和OpenCL优化。
2022-04-19 15:37:42 3.24MB OpenCL GPU
1
Hashcat for windows (GPU)
2022-04-18 11:00:46 8.25MB windows
1
tensorflow-gpu-2.6
2022-04-17 21:07:18 403.67MB tensorflow 人工智能 python 深度学习
1
因cudnn官网下载速度太慢,因此分享该资源,提高大家的效率
2022-04-17 21:07:08 388.12MB windows TensorFlow-gpu 机器学习 cudnn
1
matlab人头检测的代码用于人体姿势估计的深度高分辨率表示学习(CVPR 2019) 消息 [2019/08/27] HigherHRNet现已启动,这是由HRNet支持的自下而上的人体姿态估计方法。 我们还将在发布代码和模型,敬请期待! 我们的新作品可在上找到。 我们的HRNet已应用于多种视觉任务,例如和。 介绍 这是的非官方pytorch实现。 主要结果 MPII val的结果 拱 头 肩膀 弯头 手腕 时髦的 膝盖 踝 吝啬的 均值@ 0.1 pose_resnet_50 96.4 95.3 89.0 83.2 88.4 84.0 79.6 88.5 34.0 pose_resnet_101 96.9 95.9 89.5 84.4 88.4 84.5 80.7 89.1 34.0 pose_resnet_152 97.0 95.9 90.0 85.0 89.2 85.3 81.3 89.6 35.0 pose_hrnet_w32 97.1 95.9 90.3 86.4 89.1 87.1 83.3 90.3 37.7 笔记: 使用翻转测试。 输入大小为256x256 pose
2022-04-17 09:41:13 143KB 系统开源
1
multi_gpu_test 在多GPU机器上使用PyTorch进行并行化(已在Google Cloud GPU机器上测试) 设置带有一个或多个GPU的Google云机的脚本(要购买GPU机,请参阅以获取说明) Pytorch安装步骤/脚本 测试实用程序以检查多GPU执行 安装步骤 购买GPU机器后(有关说明,请参见 ) 运行first.sh-这将为后续步骤安装基本实用程序 运行second.sh-按照显示的链接中的说明获取Nvidia的驱动程序。 此存储库中提供了针对Ubuntu 16.04的安装(在second.sh中-默认情况下已注释) 使用nvidia_smi确认正确的安装 运行third.sh-这将安装anaconda,pytorch。 执行多GPU测试 conda激活伯特 python multi_gpu.py 请注意,这30个输入的批次分布在8个GPU上-7个G
2022-04-16 17:56:38 623KB Shell
1
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。本书首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA c的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA c中每个功能的适用场合,并编写出高性能的CUDA软件。
2022-04-16 09:30:39 44.71MB cuda gpu
1
基于 GPU 的 LDPC 码(Low-Density Parity-Check codes,低密度 奇偶校验码)软件译码器优化设计方法。选用了适用于 GPU 架构的基于最小和算 法的分层迭代译码方法开展译码器的设计工作。在并行译码方式上分别给出了码字间 和码字内并行处理方案,并基于 CUDA(Compute Unified Device Architecture)多线程 模型优化了码字映射规则。为提升译码内核执行效率,提出的优化方法包括:设计满 足负载平衡的合理资源分配、针对最小和算法中的并行规约数值求解以及译码层更新 的分支优化,实现对 GPU 硬件资源的高效利用;通过对 LDPC 码校验矩阵优化存储结 构以及多种译码信息量化方式合并存储策略的设计,提升译码过程中的数据访问效率。 其二,本文给出了基于 GPU 的卷积码软件译码器优化设计方法
2022-04-15 18:02:14 10.62MB CCSDS LDPC GPU运行