用opencv改写的GIMP的颜色增强,Opencv2.4.13Gpu+Cuda8.0.文章参考:http://blog.csdn.net/hyqwmxsh/article/details/77980709。 opencv2.4.13Gpu版:http://blog.csdn.net/hyqwmxsh/article/details/75228886
2024-07-30 13:21:08 3KB 颜色增强
1
NVIDIA TensorRT 是一款用于高性能深度学习推理的 SDK,包含深度学习推理优化器和运行时,可为推理应用程序提供低延迟和高吞吐量。YOLOv10是清华大学研究人员近期提出的一种实时目标检测方法,通过消除NMS、优化模型架构和引入创新模块等策略,在保持高精度的同时显著降低了计算开销,为实时目标检测领域带来了新的突破。 该代码将演示如何使用NVIDIA TensorRT C++ API 部署YOLOv10目标检测模型,实现模型推理加速。经过测试,推理可以实现2ms所有,全流程包含前后处理仅有15ms左右。 此处提供了项目源码以及模型文件。
2024-06-06 15:21:53 24.38MB
1
蒙特卡洛eXtreme(MCX)-CUDA版 作者:方千千(neu.edu的q.fang) 许可证:GNU通用公共许可证版本3(GPLv3) 版本:1.8(v2020,狂暴费米子) 网站: : 表中的内容: 什么是新的 MCX v2020代表着快速,通用和功能丰富的开源Monte Carlo 3D光子模拟器开发的新里程碑。 它在功能和稳定性方面都进行了许多改进。 我们要特别强调以下主要新增功能: 内置基准,易于新用户测试和采用 过渡到JSON / JNIfTI输入/输出文件以方便数据共享 使用二进制量数据将模拟导出为JSON 适用于MCXStudio / MCX / MMC /
2024-05-22 17:40:11 3.96MB pascal monte-carlo matlab cuda
1
一个 Matlab 工具箱,通过惠更斯-菲涅耳积分的数值近似来模拟单色相干光通过自由形式Kong径和粗糙/自由形式表面的光传播。 工具箱的特点是: * GPGPU 计算,使用 Nvidia 显卡和 CUDA * 如果没有找到 GPU,则回退到 CPU * 通过空间频率滤波器生成粗糙表面和表面粗糙度测定 z=f(fx,fy,Ra) * 自由曲面生成 z=f(x,y) * 对象在 3D 空间坐标(6 DOF)中的排列* 矩形 3D 网格,通过逻辑索引实现自由形式的Kong径* 人工抖动,以减少输入网格的衍射* 惠更斯-菲涅耳近似* 内存管理,如果找到预先存在的数据,则工作恢复* 一些示例和可视化 理论背景如下: Dominik Hofer,Bernhard G. Zagar,惠更斯-菲涅耳积分的数值近似–粗糙润湿问题的模拟,测量,第46卷,第8期,2013年10月,第2828-2836页,
2023-05-12 18:00:10 4.58MB matlab
1
GPUAnimatorPlugin 有两种GPU加速模式 1,每一帧缓存顶点坐标,顶点着色器根据帧数和顶点编号获取顶点进行渲染; 2,每一帧缓存骨骼变换矩阵,顶点着色器计算蒙皮; 综述 1,模式一,优点几乎不占用cpu和gpu消耗缺点动画文件体积较大(30帧左右,大概3M大小); 2,模式二,优点动画文件体积比原生动画文件还小,不占用CPU,GPU计算蒙皮;缺点GPU压力; 部分算法参考
2023-02-09 17:01:46 12.45MB C#
1
工神经网络训练所包含的运算量随着网络中神经元的数量增多而加大,对于神经元较多的网络训练 很耗时。提高人工神经网络训练速度的一个方法是对训练算法优化以减少计算量。由于人工神经网络训练算法 包含大量的矩阵和向量运算,如果把优化的算法用运行在GPU上的OpenCLC语言实现,则训练速度相比传统 基于CPU计算的实现会提高很多。从硬件的并行计算能力着手,以RPROP算法为例,对其运行在GPU上的 OpenCLC语言实现作一些研究。
2023-02-04 08:14:08 363KB opencl gpu通用计算 期刊论文
1
对应文章https://blog.csdn.net/taifyang/article/details/128089699
2022-11-29 09:28:29 4KB C++ OpenCV CUDA
1
gromacs2020.4 windows编译版(支持GPU加速)无脑安装,一直点下一步即可。 只要是独立显卡的电脑都可以支持GPU加速(本人尝试过低端显卡MX130以及高端显卡RTX2060均可成功)
2022-10-21 14:01:08 178.16MB gromacs gpu windows
1
Metal 框架使您的应用程序可以直接访问设备的图形处理单元 (GPU)。借助 Metal,应用程序可以利用 GPU 快速渲染复杂场景并并行运行计算任务。例如,这些类别的应用程序使用 Metal 来最大化它们的性能: 渲染复杂 3D 环境的游戏 视频处理应用程序,例如 Final Cut Pro 分析和处理大型数据集的科学研究应用程序
2022-08-24 18:00:47 5.01MB metal GPU加速
1
###Borehole-pyopencl 如果您在研究中使用了钻Kong pyopencl 代码,我们将不胜感激引用以下文章: “在异构地层中沿钻Kong模拟声波:使用 PyOpenCL 加速 2.5-D 有限差分” ,Ursula Iturrarán-Viveros、Miguel Molero,计算机与地球科学 56, 2013, 161-169 抽象的: 本文介绍了一种 2.5 维有限差分 (FD) 代码的实现,用于对圆柱坐标中的声学全波形单极子测井进行建模,这些记录使用新的并行计算设备 (PCD) 进行加速。 为此,我们使用行业开放标准开放计算语言 (OpenCL) 和名为 PyOpenCL 的开源工具包。 OpenCL 相对于类似语言的优势在于,它允许对 CPU(中央处理单元)、GPU(图形处理单元)或多个 GPU 以及它们之间以及它们与 CPU 或主机设备的交互进行编程。
2022-07-19 21:20:13 100KB Python
1