下面小编就为大家带来一篇使用Python写CUDA程序的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
2022-05-08 15:05:12 49KB cuda python
1
| | 什么是新的? ThunderGBM获得了IEEE计算机协会出版委员会颁发的IEEE并行和分布式系统事务奖(2019年最佳论文奖)(在987篇论文中,有1篇是因为“ Zeyi Wen ^,Jiahuaai Shi *,Bingsheng He,Jian Chen,Kotagiri Ramamohanarao和李勤彬*,“为高效梯度提升决策树训练开发GPU”,IEEE并行和分布式系统交易,第30卷,第12期,2019年,第2706-2717页。”)。 查看更多详细信息: , 总览 ThunderGBM的任务是帮助用户轻松有效地应用GBDT和随机森林来解决问题。 ThunderGBM利用G
2022-05-08 14:50:49 11.94MB machine-learning random-forest gpu cuda
1
大数据-算法-面向可逆逻辑综合的QM算法并行设计与基于CUDA的实现.pdf
2022-05-07 14:06:45 3.6MB big data 算法 文档资料
《GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。
2022-05-05 17:03:47 10.5MB GPU 高性能计算 CUDA 实例
1
cuda容器 可以让你在gpu上像cpu上一样编程
2022-05-05 16:02:15 58KB cuda thrust 容器
1
使用Python和CUDA进行动手GPU编程 这是Packt发布的《 进行的代码库。 探索使用CUDA的高性能并行计算 这本书是关于什么的? 使用Python和CUDA进行动手GPU编程必将步入正轨:您将首先学习如何应用阿姆达尔定律,使用代码分析器来识别Python代码中的瓶颈,并设置合适的GPU编程环境。 然后,您将看到如何“查询” GPU的功能以及如何在GPU自身的内存之间来回复制数据数组。 本书涵盖以下激动人心的功能: 直接从Python启动GPU代码 编写有效,高效的GPU内核和设备功能 使用诸如cuFFT,cuBLAS和cuSolver之类的库 使用Nsight和Visual Profiler调试和分析代码 将GPU编程应用于数据科学问题 从头开始构建基于GPU的深度神经网络 探索高级GPU硬件功能,例如经线改组 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代
2022-05-04 18:40:36 136KB Python
1
windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe windows10显卡驱动456.71-notebook-win10-64bit-international-nsd-dch-whql.exe
2022-05-03 09:06:43 610.93MB 显卡驱动 NVIDIA cuda
1
此处提供的代码是“多尺度加权核规范图像复原”计算机视觉和模式识别会议( )的实现。 请随时通过与我联系。 Noam Yair。 运行代码 一个简单的例子对于单个图像去模糊示例,请运行“ RunMe.m”文件。 复制纸本实验要进行纸质实验,请使用“ ReproduceExperiments.m”文件,并按照文档中的说明进行操作。 对于一个简单的示例,您也可以按原样运行此功能。 附加选项运行该算法的其他选项是使用“ RunAlgorithm”函数/文件,尽管该函数需要一些输入(损坏的图像,噪声水平等)。 请遵循此功能的文档以直接使用它。 注意:“ RunMe.m”函数的目的是为“ RunAlgorithm”函数创建适当的输入,然后调用它。 因此,您可能会发现使用“ RunMe.m”功能更为方便。 要求和依存关系 具有图像处理工具箱的Matlab。 使用IRCNN方法进行初始化时,请参
2022-05-02 21:58:51 54.21MB Cuda
1
cuda课程作业程序 配合将以一块使用 一共10个文件及文件夹
2022-05-02 11:48:47 6.27MB cuda code 编程
1
The CUDA Handbook begins where CUDA by Example (Addison-Wesley, 2011) leaves off, discussing CUDA hardware and software in greater detail and covering both CUDA 5.0 and Kepler. Every CUDA developer, from the casual to the most sophisticated, will find something here of interest and immediate usefulness. Newer CUDA developers will see how the hardware processes commands and how the driver checks progress; more experienced CUDA developers will appreciate the expert coverage of topics such as the driver API and context migration, as well as the guidance on how best to structure CPU/GPU data interchange and synchronization. The accompanying open source code-more than 25,000 lines of it, freely available at www.cudahandbook.com-is specifically intended to be reused and repurposed by developers. Designed to be both a comprehensive reference and a practical cookbook, the text is divided into the following three parts: Part I, Overview, gives high-level descriptions of the hardware and software that make CUDA possible. Part II, Details, provides thorough descriptions of every aspect of CUDA, including * Memory * Streams and events * Models of execution, including the dynamic parallelism feature, new with CUDA 5.0 and SM 3.5 * The streaming multiprocessors, including descriptions of all features through SM 3.5 * Programming multiple GPUs * Texturing The source code accompanying Part II is presented as reusable microbenchmarks and microdemos, designed to expose specific hardware characteristics or highlight specific use cases. Part III, Select Applications, details specific families of CUDA applications and key parallel algorithms, including * Streaming workloads * Reduction * Parallel prefix sum (Scan) * N-body * Image ProcessingThese algorithms cover the full range of potential CUDA applications.
2022-04-30 03:18:09 2.35MB CUDA Handbook GPU Programming
1