CUDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。本书首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA c的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA c中每个功能的适用场合,并编写出高性能的CUDA软件。
2022-04-16 09:30:39 44.71MB cuda gpu
1
PyTorch | (1)初识PyTorch PyTorch | (2)PyTorch 入门-张量 PyTorch | (3)Tensor及其基本操作 Tensor attributes: 在tensor attributes中有三个类,分别为torch.dtype, torch.device, 和 torch.layout 其中, torch.dtype 是展示 torch.Tensor 数据类型的类,pytorch 有八个不同的数据类型,下表是完整的 dtype 列表. Torch.device 是表现 torch.Tensor被分配的设备类型的类,其中分为’cpu’ 和 ‘cuda’
2022-04-16 03:02:08 123KB c cuda ens
1
疫情在家起见,效率真的很低,还好马上就要开学了,最近有个作业需要用到deep learning,要用到gpu跑,因此记录一下我的配环境过程,来回折腾了两天,版本不对称问题很头疼,下面直接给出我的电脑配置以及环境。 1.操作系统:WIN10 2.电脑型号:magicbook2018 3.CPU:i7-8550U 4.GPU:MX150 5.显卡驱动:445.87 6.cuda版本:cuda_10.0.130_411.31_win10 7.cudnn版本:cudnn-10.0-windows10-x64-v7.6.4.38 8.Anaconda3版本:4.8.3 9.python版本:3.7.3
2022-04-15 14:11:14 111KB c cb conda
1
LDPC码并行译码算法的研究及其基于CUDA的实现
2022-04-15 11:10:45 2.49MB LDPC码 CUDA
1
教你在最短的时间内掌握CUDA与MFC的联调方法 设置,示例一网打尽!极好的入门教材
2022-04-14 20:08:24 565KB CUDA MFC
1
包含Centos7.x版本docker与cuda安装及一些配置建议
2022-04-12 20:00:36 671KB docker 容器 运维
1
matlab基本运算程序代码了解CUDA编程 这是Packt发布的的代码存储库。 使用CUDA 10.x和C / C ++进行GPU编程和并行计算的初学者指南 这本书是关于什么的? 计算统一设备架构(CUDA)是NVIDIA的GPU计算平台和应用程序编程接口。 它旨在与C,C ++和Python等编程语言一起使用。 借助CUDA,您可以在科学,医疗保健和深度学习领域中将GPU的并行计算能力用于一系列高性能计算应用程序。 本书涵盖以下激动人心的功能: 了解CUDA中的常规GPU操作和编程模式 揭示GPU编程和CPU编程之间的差异 分析GPU应用程序性能并实施优化策略 探索GPU编程,性能分析和调试工具 掌握并行编程算法以及如何实现它们,通过多GPU和多节点扩展GPU加速的应用程序深入到具有加速库,Python和OpenACC的GPU编程平台,从而深入了解使用GPU的CNN和RNN中的深度学习加速器 如果您觉得这本书适合您,那就赶快行动吧! 说明和导航 所有代码都组织在文件夹中。 例如,Chapter02。 该代码将如下所示: #include #include<stdl
2022-04-12 19:43:43 70.17MB 系统开源
1
fdtd3d 这是FDTD Maxwell方程求解器的开源实现,适用于不同维度(1、2或3),并在需要时支持并发(MPI / OpenMP / Cuda)以及不同体系结构(x64,Arm,Arm64)。 关键思想是使用不同的组件来构建满足您特定需求的求解器,即具有启用的MPI的并发支持,OpenMP或GPU支持,并行缓冲区类型,特定尺寸等。 OpenMP支持WIP。 有关当前项目开发状态和未来计划的更多信息,请检查问题和里程碑,有关文档,请参见。 同样,可以从./Doxyfile config生成doxygen文档: sudo apt-get install doxygen doxygen firefox docs/index.html 建造 使用cmake完成构建: mkdir Release cd Release cmake .. -DCMAKE_BUILD_TYPE=Rele
2022-04-10 21:56:46 1.75MB c-plus-plus arm cpp simulation
1
压缩包文件是我这段时间学习CUDA的一些资料汇总,包括了CUDA编程手册、CUDA 教程、CUDA 的经典入门以及GPU+CUDA学习资料等,对于初学者帮助很大,我就是这么学过来的。好不容易才找到的,希望对大家有帮助。
2022-04-07 13:39:04 17.58MB CUDA编程手册 CUDA 教程 CUDA
1
北航 CUDA编程 专业课课件 CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台,CUDA使GPU能够解决复杂的计算问题。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行
2022-04-07 13:36:23 16.04MB cuda 并行计算 NVIDIA GPU
1