DeepSpeech:DeepSpeech是一种开源嵌入式(离线,设备上的)语音到文本引擎,可以在从Raspberry Pi 4到大功率GPU服务器的各种设备上实时运行
2023-03-15 21:18:57 6.19MB machine-learning embedded deep-learning offline
1
杰库达 JCuda-CUDA的Java绑定 有关更多信息和构建说明,请参考 。
2023-03-11 16:22:28 611KB java gpu cuda Java
1
对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(opencomputing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化 策略。将OpenCL与计算统一设备架构CUDA(computeunified device architecture)及其它通用计算技术进行对比。对比 结果表明,OpenCL能够充分发挥异构处理平台上各种处理器的性能潜力,充分合理地分配任务,为进行大规模并行计算 提供了新的强有力的工具。
2023-03-10 15:46:38 443KB opencl GPU通用计算 期刊论文
1
CUDA入门必备的书籍 想学CUDA的必看哦 中文的书学习来相对容易点
2023-03-10 15:42:34 14.3MB GPU CUDA 高性能计算
1
注意:ASTRA层析成像工具箱现在托管在http://www.astra-toolbox.com/上。ASTRA层析成像工具箱是基于ASTRA-Vision联合开发的用于2D和3D层析成像的高性能GPU原语的MATLAB工具箱。阿姆斯特丹安特卫普大学和CWI实验室研究组。 它支持2D平行和扇形几何,以及3D平行和锥形束。 它们都具有高度灵活的源/检测器定位。 大量2D和3D算法可用,包括FBP,SIRT,SART,CGLS。 基本的向前和向后投影操作都是GPU加速的,可以直接从MATLAB调用以启用构建新算法的功能。
2023-03-09 14:54:55 31.52MB 开源软件
1
基于中央处理器(CPU)串行的人群疏散传统方法对于人群规模较少的场景,可以得到良好的疏散模拟效果,但在人群密度较高的场景中,难以达到实时模拟的要求.为了克服上述问题,实现了一种基于图形处理器(GPU)的人群疏散模拟的方法.该方法通过对个体寻径算法的优化,不仅能使个体快速准确地智能寻径,而且将个体寻径独立性与图形处理器高性能计算特性进行结合,充分利用了图形处理器强大的并行计算能力,从而大幅度提高了人群疏散模拟的人群规模,使人群疏散模拟的实时性得到增强.
1
动画角色的AnimMap Baker 描述: 使用GPU来实现大量动画角色渲染。 顶点着色器的动画贴图,用于在运行时修改网格的顶点位置。 使用GPU实例化减少绘制调用。 使用Unity的AR Foundation在旧版iPhone 7上在现实世界中创建10,000个玩具士兵。 初始版本于2017年7月30日在GitHub上发布,当然,它仍在GitHub上。 但是,如果您能给我买杯咖啡,我会很高兴的:-)。 最近,我添加了对Unity 2019的支持,因此可以从Unity 5.x到Unity 2019使用它。 我将创建一个视频教程来演示如何使用它。 如果您想进一步了解其背后的实现,
2023-03-06 14:23:53 2.52MB unity baker gpu-instancing draw-calls
1
Anaconda必备的安装包,离线下载下来的,需要的自己取
2023-03-02 22:59:28 2KB Anaconda
1
tensorflow-gpu缺少的cublas64_11.dll等.dll文件全在这了,我打包了所有的文件。
2023-02-28 10:11:47 734.1MB tensorflow gpu
1
本文用cuda平台,用粗粒度写法将粒子群写法并行化,每个线程对应一个粒子,用于解决0-1背包问题,该方法中对随机数可以进行进一步的优化。
2023-02-26 19:51:48 8KB 粒子群 GPU 0-1背包
1