cuda容器 可以让你在gpu上像cpu上一样编程
2022-05-05 16:02:15 58KB cuda thrust 容器
1
使用Python和CUDA进行动手GPU编程 这是Packt发布的《 进行的代码库。 探索使用CUDA的高性能并行计算 这本书是关于什么的? 使用Python和CUDA进行动手GPU编程必将步入正轨:您将首先学习如何应用阿姆达尔定律,使用代码分析器来识别Python代码中的瓶颈,并设置合适的GPU编程环境。 然后,您将看到如何“查询” GPU的功能以及如何在GPU自身的内存之间来回复制数据数组。 本书涵盖以下激动人心的功能: 直接从Python启动GPU代码 编写有效,高效的GPU内核和设备功能 使用诸如cuFFT,cuBLAS和cuSolver之类的库 使用Nsight和Visual Profiler调试和分析代码 将GPU编程应用于数据科学问题 从头开始构建基于GPU的深度神经网络 探索高级GPU硬件功能,例如经线改组 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代
2022-05-04 18:40:36 136KB Python
1
windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe
2022-05-03 09:06:43 610.93MB 显卡驱动 NVIDIA cuda
1
此处提供的代码是“多尺度加权核规范图像复原”计算机视觉和模式识别会议( )的实现。 请随时通过与我联系。 Noam Yair。 运行代码 一个简单的例子对于单个图像去模糊示例,请运行“ RunMe.m”文件。 复制纸本实验要进行纸质实验,请使用“ ReproduceExperiments.m”文件,并按照文档中的说明进行操作。 对于一个简单的示例,您也可以按原样运行此功能。 附加选项运行该算法的其他选项是使用“ RunAlgorithm”函数/文件,尽管该函数需要一些输入(损坏的图像,噪声水平等)。 请遵循此功能的文档以直接使用它。 注意:“ RunMe.m”函数的目的是为“ RunAlgorithm”函数创建适当的输入,然后调用它。 因此,您可能会发现使用“ RunMe.m”功能更为方便。 要求和依存关系 具有图像处理工具箱的Matlab。 使用IRCNN方法进行初始化时,请参
2022-05-02 21:58:51 54.21MB Cuda
1
cuda课程作业程序 配合将以一块使用 一共10个文件及文件夹
2022-05-02 11:48:47 6.27MB cuda code 编程
1
The CUDA Handbook begins where CUDA by Example (Addison-Wesley, 2011) leaves off, discussing CUDA hardware and software in greater detail and covering both CUDA 5.0 and Kepler. Every CUDA developer, from the casual to the most sophisticated, will find something here of interest and immediate usefulness. Newer CUDA developers will see how the hardware processes commands and how the driver checks progress; more experienced CUDA developers will appreciate the expert coverage of topics such as the driver API and context migration, as well as the guidance on how best to structure CPU/GPU data interchange and synchronization. The accompanying open source code-more than 25,000 lines of it, freely available at www.cudahandbook.com-is specifically intended to be reused and repurposed by developers. Designed to be both a comprehensive reference and a practical cookbook, the text is divided into the following three parts: Part I, Overview, gives high-level descriptions of the hardware and software that make CUDA possible. Part II, Details, provides thorough descriptions of every aspect of CUDA, including * Memory * Streams and events * Models of execution, including the dynamic parallelism feature, new with CUDA 5.0 and SM 3.5 * The streaming multiprocessors, including descriptions of all features through SM 3.5 * Programming multiple GPUs * Texturing The source code accompanying Part II is presented as reusable microbenchmarks and microdemos, designed to expose specific hardware characteristics or highlight specific use cases. Part III, Select Applications, details specific families of CUDA applications and key parallel algorithms, including * Streaming workloads * Reduction * Parallel prefix sum (Scan) * N-body * Image ProcessingThese algorithms cover the full range of potential CUDA applications.
2022-04-30 03:18:09 2.35MB CUDA Handbook GPU Programming
1
学习gpu的好资料,适合新手学习gpu的好资料,适合新手学习gpu的好资料,适合新手
2022-04-28 18:04:53 22.23MB GPU CUDA
TensorRT是可以在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。我们利用Pytorch、TF或者其他框架训练好的模型,可以转化为TensorRT的格式,然后利用TensorRT推理引擎去运行我们这个模型,从而提升这个模型在英伟达GPU上运行的速度。速度提升的比例是比较可观的。TensorRT是由C++、CUDA、python三种语言编写成的一个库,其中核心代码为C++和CUDA,Python端作为前端与用户交互。当然,TensorRT也是支持C++前端的,如果我们追求高性能,C++前端调用TensorRT是必不可少的。
2022-04-27 17:22:37 824.27MB TensorRT
1
CUDA并行程序设计:GPU编程指南共分为12章。第1章从宏观上介绍流处理器演变历史。第2章详解GPU并行机制,深入理解串行与并行程序,以辩证地求解问题。第3章讲解CUDA设备及相关的硬件和体系结构,以实现优CUDA程序性能。第4章介绍CUDA开发环境搭建和可用调试环境。第5章介绍与CUDA编程紧密相关的核心概念——网格、线程块与线程,并通过示例说明线程模型与性能的关系。第6章借助实例详细讲解了不同类型内存的工作机制,并指出实践中容易出现的误区。第7章细述多任务的CPU和GPU协同,并介绍多个CPU/GPU编程秘技。第8章介绍如何在应用程序中编写和使用多GPU。第9章详述CUDA编程性能限制因素、分析CUDA代码的工具和技术。第10章介绍编程实践中的库与软件开发工具包。第11章讲解如何设计基于GPU的系统。第12章总结CUDA应用中易犯错误以及应对建议。
2022-04-27 16:52:21 131.27MB CUDA GPU 并行编程 中文带目录
1
cuda 9.2 64位运行库,发现在网上找不到这个版本的库,上传一下。
2022-04-27 15:16:30 14.81MB cuda 9.2
1