随着COSMO-Sky Med、Terra SAR-X等高分辨率SAR卫星的投入使用,SAR数据处理的计算量呈现几何级数增长趋势,对计算资源的要求越来越高,文中通过实验表明,基于图形处理单元(GPU)的并行计算技术可以大大提高星载SAR影像数据重采样计算的效率。
2022-05-15 22:32:41 1.44MB GPU CUDA SAR 重采样
1
并行 C 程序 挪威科技大学并行计算课程中的练习。 介绍 作为对 C 的简单介绍以帮助我们入门,本练习在 C 中实现了一些与矩阵相关的计算。 区域随着 MPI 增长 在这个练习和以下许多练习中,我们被要求解决一个区域增长问题。 问题如下。 您有一个二维像素网格,每个像素都有一个灰度颜色(0 到 255 之间的一个字节)。 给定一个阈值和一些位置(种子),如果颜色差异低于阈值,您将把种子“生长”到相邻像素。 继续扩大该地区,直到它不再增长。 在本练习中,我们将使用MPI实现它, MPI是一种用于并行计算的消息传递协议。 串行优化 引用练习:“在这个问题中,你应该编写一个函数来尽可能快地执行稀疏矩阵向量乘法。你应该通过在文件 spmv.c 中实现乘法函数来做到这一点。你的函数应该比包含的函数更快乘以天真。您可以使用 struct s 矩阵 t 创建自己的稀疏矩阵格式。” 使用 pth
2022-05-15 22:07:18 956KB C
1
文件是TensorRT-7.1.3.4.CentOS-7.6.x86_64-gnu.cuda-10.2.cudnn8.0.tar
2022-05-13 22:05:36 742.22MB 加速 tensorrt
1
高性能和高质量的图像模糊
2022-05-13 20:39:02 685KB VC7.1 VC8.0 VC7.0 Win2003
1
具有并行计算的卷积神经网络的C ++库(openMP,CUDA,MPI) 用法: g ++ -std = c ++ 11 -fopenmp lenet.cpp -o lenet ./lenet 这是模型的多线程版本(具有数据并行性),您可以使用以下方法更改线程数: 导出OMP_NUM_THREADS = 4 要使用MPI版本的代码,您需要使用mpic ++进行编译: mpic ++ -std = c ++ 11 -fopenmp lenet.cpp -o lenet 您可以在多节点系统上运行它! 创建自己的网络 您可以通过派生Model类并使用addLayer()方法按顺序添加所有图层来创建自己的深度神经网络类。 您还可以通过扩展ActivationLayer来引入自己的激活层。 您可以通过扩展LossFunction类来创建自定义Loss函数。 工作正在进行中 使用以下方法进
2022-05-13 18:00:15 10.98MB C++
1
CUDA Programming,中文名:CUDA并行程序设计-GPU编程指南 2014年 含书签,高清。
2022-05-13 10:56:03 143.79MB cuda GPU编程
1
运用OpenMP和CUDA优化蒙特卡洛算法.doc
2022-05-13 09:06:56 2.33MB 算法 文档资料
GPU高性能编程CUDA实战中文版.pdf
2022-05-11 11:03:34 28.95MB GPU,CUDA
1
OpenCV从3.0开始,将部分算法封装在Contrib包中,并且仅发行源代码,给开发带来很大不便。本安装包是通过2017年10月27日从官方Git网站上下载的主线代码编译而成,几乎包含了全部的OpenCV3.3.1功能。该包的编译时间接近10小时,希望能给使用OpenCV的开发人员带来方便。
2022-05-10 17:48:05 67.16MB OpenCV331
1
Linux创始人LinusTorvalds有一句名言:Talk is cheap, Show me the code.(冗谈不够,放码过来!)。 代码阅读是从入门到提高的必由之路。尤其对深度学习,许多框架隐藏了神经网络底层的实现,只能在上层调包使用,对其内部原理很难认识清晰,不利于进一步优化和创新。 YOLOv3是一种基于深度学习的端到端实时目标检测方法,以速度快见长。 YOLOv3的实现Darknet是使用C语言开发的轻型开源深度学习框架,依赖少,可移植性好,可以作为很好的代码阅读案例,让我们深入探究其实现原理。 本课程将解析YOLOv3的实现原理和源码,具体内容包括:      YOLO目标检测原理       神经网络及Darknet的C语言实现,尤其是反向传播的梯度求解和误差计算      代码阅读工具及方法      深度学习计算的利器:BLAS和GEMM      GPU的CUDA编程方法及在Darknet的应用      YOLOv3的程序流程及各层的源码解析本课程将提供注释后的Darknet的源码程序文件。 除本课程《YOLOv3目标检测:原理与源码解析》外,
1