对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(opencomputing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化 策略。将OpenCL与计算统一设备架构CUDA(computeunified device architecture)及其它通用计算技术进行对比。对比 结果表明,OpenCL能够充分发挥异构处理平台上各种处理器的性能潜力,充分合理地分配任务,为进行大规模并行计算 提供了新的强有力的工具。
2023-03-10 15:46:38 443KB opencl GPU通用计算 期刊论文
1
工神经网络训练所包含的运算量随着网络中神经元的数量增多而加大,对于神经元较多的网络训练 很耗时。提高人工神经网络训练速度的一个方法是对训练算法优化以减少计算量。由于人工神经网络训练算法 包含大量的矩阵和向量运算,如果把优化的算法用运行在GPU上的OpenCLC语言实现,则训练速度相比传统 基于CPU计算的实现会提高很多。从硬件的并行计算能力着手,以RPROP算法为例,对其运行在GPU上的 OpenCLC语言实现作一些研究。
2023-02-04 08:14:08 363KB opencl gpu通用计算 期刊论文
1
基于GPU通用计算,从几个方面对其进行了探讨与研究,很不错的期刊论文,推荐学习GPU通用计算的同学们学习。
2021-11-19 14:11:40 3.73MB GPU通用计算 期刊论文
1
GPU计算简介 关于 GPU 通用计算的研讨会演示的幻灯片和示例代码。 计算机图形学研讨会 MTAT.03.296 塔尔图大学2014年
2021-07-03 14:06:21 13.1MB C++
1