上传者: 42128537
|
上传时间: 2022-09-05 11:42:38
|
文件大小: 14KB
|
文件类型: ZIP
CUDA中的膨胀和侵蚀过滤器
显示了膨胀和腐蚀过滤器的几种实现方式:
中央处理器: 使用可分离的过滤器。 ( )
GPU: 2.天真的实现,一个线程每个像素加载n ^ 2个元素。 ( )3.可分离的滤波器实现,处理过程分为两个步骤,每个像素仅加载2 * n个元素。 ( )4.共享内存的实现,使用了切片方法。 ( )5.过滤器的无线电被模板化,以使主回路能够展开。 (腐蚀 )6.对过滤操作进行模板化,以将相同的代码重新用于腐蚀和膨胀。 ( )
表现
我已经在Nvidia GTX 760上进行了一些测试。
使用1280x1024的图片和2到15的收音机:
广播/实施
加速
中央处理器
幼稚的
可分离
共享的内存。
广播模板
过滤操作。 模板化
2个
34倍
0.07057秒
0.00263秒
0.00213秒
0.00209秒
0.00207秒
0.00207秒
3
42倍
0