基于GPU 并行的重力, 重力梯度三维正演快速计算及反演策略
2022-05-07 19:06:54 822KB 文档资料
matlab雷达界面代码OSUBP 由俄亥俄州立大学电气与计算机工程学系与生物医学信息学系合作开发的,用于合成Kong径雷达成像的GPU加速反投影。 潜入: 内核:(阅读本文) PyCUDA设置:(运行此) 即将来临: 平铺 双重支持 PyCUDA中的实时代码生成 进一步分析Matlab和CUDA成像仪之间的输出错误 非Matlab数据加载器,预处理器和可视化 仅限Matlab的MEX界面 所需的软件包: Python CUDA 皮卡达 裹包 Matlab的数据加载 受到推崇的: 智者 原始阶段历史记录GOTCHA公共数据集:城市环境中的GOTCHA体积SAR数据集和基于SAR的GMTI质询问题(请忽略“无效的SSL证书”警告,并发送电子邮件给SDMS要求他们修复) 参考: AFRL bpBasic Matlab软件包:请与LeRoy Gorham先生联系,AFRL :,并参见Gorham等人的MATLAB SAR图像形成工具箱 IEEE Radar Conference 2010出版物:Fasih等人,CUDA中GPU加速的合成Kong径雷达反投影 PPAC @ IEEE Clust
2022-05-06 16:49:29 1.06MB 系统开源
1
GPU Pro 360 Guide to Rendering,高清原版pdf。。。。。
2022-05-06 11:47:15 120.92MB 图形 渲染 GPU Graphics
1
GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。
2022-05-05 17:03:47 10.5MB GPU 高性能计算 CUDA 实例
1
xfeat ||| 使用GPU和柔性特征工程与探索库。 xfeat提供了类似于sklearn的转换类,用于要素工程和探索。与sklearn API不同,xfeat提供了一个数据帧输入,数据帧输出接口。 xfeat支持和数据帧。通过使用cuDF和 ,xfeat可以比原始的熊猫操作快10到30倍地生成特征。 分组汇总基准() 目标编码基准() 文档 Optuna的功能选择 目录中提供了更多示例。 快速开始 xfeat提供了一个数据帧输入,数据帧输出接口: 特征工程 可以使用xfeat.Pipeline顺序连接编码器对象。为避免重复相同的特征提取过程,将结果输出为羽毛文件格式很有用。 提供更多编码器类。 import pandas as pd from xfeat import Pipeline , SelectNumerical , ArithmeticCombinations # 2-o
2022-05-05 10:04:14 1.07MB Python
1
使用Python和CUDA进行动手GPU编程 这是Packt发布的《 进行的代码库。 探索使用CUDA的高性能并行计算 这本书是关于什么的? 使用Python和CUDA进行动手GPU编程必将步入正轨:您将首先学习如何应用阿姆达尔定律,使用代码分析器来识别Python代码中的瓶颈,并设置合适的GPU编程环境。 然后,您将看到如何“查询” GPU的功能以及如何在GPU自身的内存之间来回复制数据数组。 本书涵盖以下激动人心的功能: 直接从Python启动GPU代码 编写有效,高效的GPU内核和设备功能 使用诸如cuFFT,cuBLAS和cuSolver之类的库 使用Nsight和Visual Profiler调试和分析代码 将GPU编程应用于数据科学问题 从头开始构建基于GPU的深度神经网络 探索高级GPU硬件功能,例如经线改组 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代
2022-05-04 18:40:36 136KB Python
1
基于图形处理器(GPU) 的通用计算
2022-05-04 14:06:24 702KB 源码软件
GPU编程与CG语言之阳春白雪下里巴人.pdfGPU编程与CG语言之阳春白雪下里巴人.pdfGPU编程与CG语言之阳春白雪下里巴人.pdf
2022-05-03 15:49:00 3MB GPU编程 CG语言
1
选址与路径优化matlab代码STOMPSelfJoin 这是 STOMP 算法的 GPU 实现。 STOMP 将时间序列作为输入并计算特定窗口大小的矩阵轮廓。 您可以在 对于附加功能和更好的性能,您应该使用 环境 这个基础项目需要: 至少有 9.0 版的 CUDA 工具包可用。 还需要具有 CUDA 支持的 NVIDIA GPU。 您可以找到与 CUDA 兼容的 GPU 列表 目前使用 Makefile 在 linux 下构建。 应该在windows下编译,但未经测试。 用法 编辑生成文件 默认情况下支持 Volta,但如果需要,请根据 GPU 的计算能力设置 ARCH 的值。 “-gencode=arch=compute_code,code=sm_code”,其中代码对应于您希望添加的计算能力或架构。 确保 CUDA_DIRECTORY 对应于系统上安装 cuda 的位置。 这通常是 Linux 上的/usr/local/cuda-(VERSION)/ 此外,默认情况下,内核参数仅针对 volta 优化,如果您正在为 Pascal 或更早版本构建,请相应地调整 STOMP.cu 中
2022-05-02 21:08:50 20.75MB 系统开源
1
使用NCCL进行多GPU深度学习训练,其中涉及多机多卡,单机多卡等技术。 Optimized inter-GPU communication for DL and HPC Optimized for all NVIDIA platforms, most OEMs and Cloud Scales to 100s of GPUs, targeting 10,000s in the near future. Aims at covering all communication needs for multi-GPU computing. Only relies on CUDA. No dependency on MPI or any parallel environment.
2022-05-01 20:37:44 453KB GPU AI 深度学习 NVIDIA
1