threejs性能优化与GPU优化
2022-08-24 09:48:41 8KB three.js threejs性能优化
1
CUDA平行最短路径 使用CUDA平台的NVIDIA GPU上的并行最短路径算法
2022-08-22 17:09:49 13KB Cuda
1
针对FDK算法重建图像异常耗时的问题,提出了一种极坐标反投影快速重建算法。根据三角函数对称性,64幅预处理后的投影数据在反投影过程中同时运算;在极坐标反投影数据映射到笛卡尔坐标时,利用像素位置相关参数的对称性,在不使用查表方法的情况下,使双线性插值的计算量大大减少。实验结果表明,采用这两种措施实现了FDK算法优化,与传统的FDK算法相比,重建速度提高8倍,采用CUDA技术,实现GPU对其加速,速度提高40倍,且均不产生新的误差。
1
包括下面几个包 cublas64_11 cublasLt64_11 cudart64_110 cudnn64_8 cufft64_10 curand64_10 cusolver64_11 cusparse64_11
2022-08-18 12:05:54 195.71MB GPU tensorflow
1
前言 深度学习涉及很多向量或多矩阵运算,如矩阵相乘、矩阵相加、矩阵-向量乘法等。深层模型的算法,如BP,Auto-Encoder,CNN等,都可以写成矩阵运算的形式,无须写成循环运算。然而,在单核CPU上执行时,矩阵运算会被展开成循环的形式,本质上还是串行执行。GPU(Graphic Process Units,图形处理器)的众核体系结构包含几千个流处理器,可将矩阵运算并行化执行,大幅缩短计算时间。随着NVIDIA、AMD等公司不断推进其GPU的大规模并行架构,面向通用计算的GPU已成为加速可并行应用程序的重要手段。得益于GPU众核(many-core)体系结构,程序在GPU系统上的运行速度相
2022-08-15 20:52:33 148KB c OR tor
1
今天小编就为大家分享一篇pytorch 指定gpu训练与多gpu并行训练示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-08-15 20:43:36 33KB pytorch gpu
1
Installing the Python Wrapper Please follow these instructions to prepare XGBoost for use with Python. I am placing xgboost in a directory called xgboost_install_dir but this can be anything. 1. git clone https://github.com/dmlc/xgboost.git xgboost_install_dir 2. copy libxgboost.dll into the xgboost_install_dir\python-package\xgboost\ directory 3. cd xgboost_install_dir\python-package\ 4. python setup.py install 下面是使用举例 import xgboost xr = xgboost.XGBRegressor() xr.fit(X, y) xr.predict(X_test)
2022-08-15 10:23:28 45.71MB xgboost gpu
1
NVIDIA-Linux-x86_64显卡驱动,适用于RTX2060显卡的设备。只需要将改软件copy到Ubuntu16.04LTS系统下./NVIDIA-Linux-x86_64-418.88.run然后一步步操作即可;安装完毕后可通过nvidia-smi 查看是否安装成功;
2022-08-12 14:46:56 104.16MB linux NVIDIA Ubuntu GPU
1
一、环境配置与测试 二、cuda与OpenCV结合方法 三、代码实例:图像均值滤波和图像反色 3.1 代码 3.2 代码说明 3.3 网格大小与线程块大小的确定 3.3.1 网格与线程块大小的限制 3.3.2 如何确定网格大小与线程块大小? 3.4 并行与串行的加速比 四、总结
2022-08-12 14:04:15 46KB opencv C++ GPU并行运算 cuda并行计算
1
unity 烘焙插件
2022-08-12 09:05:55 440.05MB Unity插件
1