tensorfflow: 2.8.0 cuda: 11.4 cudnn:8.2 tensorRT: 8.2
2022-08-24 12:53:43 471.65MB gpu tensorflow ai 人工智能
1
windows10下最新 TensorFlow GPU版 C++ 运行库编译成功-附件资源
2022-08-24 12:31:04 23B
1
libtensorflow-gpu-windows-x86_64-2.5.0.zip
2022-08-24 12:28:49 238.1MB tensorflow
1
threejs性能优化与GPU优化
2022-08-24 09:48:41 8KB three.js threejs性能优化
1
CUDA平行最短路径 使用CUDA平台的NVIDIA GPU上的并行最短路径算法
2022-08-22 17:09:49 13KB Cuda
1
针对FDK算法重建图像异常耗时的问题,提出了一种极坐标反投影快速重建算法。根据三角函数对称性,64幅预处理后的投影数据在反投影过程中同时运算;在极坐标反投影数据映射到笛卡尔坐标时,利用像素位置相关参数的对称性,在不使用查表方法的情况下,使双线性插值的计算量大大减少。实验结果表明,采用这两种措施实现了FDK算法优化,与传统的FDK算法相比,重建速度提高8倍,采用CUDA技术,实现GPU对其加速,速度提高40倍,且均不产生新的误差。
1
包括下面几个包 cublas64_11 cublasLt64_11 cudart64_110 cudnn64_8 cufft64_10 curand64_10 cusolver64_11 cusparse64_11
2022-08-18 12:05:54 195.71MB GPU tensorflow
1
前言 深度学习涉及很多向量或多矩阵运算,如矩阵相乘、矩阵相加、矩阵-向量乘法等。深层模型的算法,如BP,Auto-Encoder,CNN等,都可以写成矩阵运算的形式,无须写成循环运算。然而,在单核CPU上执行时,矩阵运算会被展开成循环的形式,本质上还是串行执行。GPU(Graphic Process Units,图形处理器)的众核体系结构包含几千个流处理器,可将矩阵运算并行化执行,大幅缩短计算时间。随着NVIDIA、AMD等公司不断推进其GPU的大规模并行架构,面向通用计算的GPU已成为加速可并行应用程序的重要手段。得益于GPU众核(many-core)体系结构,程序在GPU系统上的运行速度相
2022-08-15 20:52:33 148KB c OR tor
1
今天小编就为大家分享一篇pytorch 指定gpu训练与多gpu并行训练示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-08-15 20:43:36 33KB pytorch gpu
1
Installing the Python Wrapper Please follow these instructions to prepare XGBoost for use with Python. I am placing xgboost in a directory called xgboost_install_dir but this can be anything. 1. git clone https://github.com/dmlc/xgboost.git xgboost_install_dir 2. copy libxgboost.dll into the xgboost_install_dir\python-package\xgboost\ directory 3. cd xgboost_install_dir\python-package\ 4. python setup.py install 下面是使用举例 import xgboost xr = xgboost.XGBRegressor() xr.fit(X, y) xr.predict(X_test)
2022-08-15 10:23:28 45.71MB xgboost gpu
1