头发分割源码。:头发检测(CUDA版本)和头发修复-源码
2022-02-12 11:06:29 2.81MB 头发分割 图像分割 人脸识别
1
cuda by example,中文版,是好东西哦~
2022-02-08 16:28:05 3.2MB cuda
1
cuda c 最佳实践 This is a manual to help developers obtain the best performance from the NVIDIA CUDA Architecture. It presents established optimization techniques and explains coding metaphors and idioms that can greatly simplify progarmming for the CUDA architecture.
2022-02-07 17:54:11 2.06MB cuda c
1
实现大文本、多文件并行分词,自动生成分词文件,通过hash表大大减少分词时间
1
最新的CUDA用C语言的编程指南。最新的CUDA用C语言的编程指南。
2022-02-04 17:22:21 5.68MB CUDA C C++ 深度学习
1
Understanding the Overheads of Launching CUDA Kernels.pdf
2022-01-30 09:09:03 546KB CUDA Kernels Overheads
1
CUDA中PyTorch的软DTW 用于PyTorch的快速CUDA实现。 基于但运行速度最高可提高100倍! forward()和backward()传递都使用CUDA实现。 我的实现部分受到启发,其中提出了基于对角线的Belman递归实现。 入门 此代码取决于和 。 只需在您的项目中包含soft_dtw_cuda.py ,就可以了! 您还可以运行随附的事件探查器/测试(已通过Python v3.6测试),并查看获得的加速效果: git clone https://github.com/Maghoumi/pytorch-softdtw-cuda cd pytorch-softdtw-cuda python soft_dtw_cuda.py 用法示例 脚本中已经提供了示例代码。 这是一个简单的例子: from soft_dtw_cuda import SoftDTW # Crea
2022-01-28 10:40:49 10KB deep-learning cuda pytorch dynamic-time-warping
1
cufftShift 基于CUDA的线性1D,2D和3D FFT移位功能实现。
2022-01-27 14:31:21 28KB C++
1
快速流网
2022-01-27 12:27:27 38.29MB Cuda
1
1. 版本:OpenCV 4.5.5 2. 编译器:Visual Studio 2022 (VC17),CUDA 11.5 3. 平台: Windows 10 x64,GTX 1060 4. 说明:有CUDA和CUDANN,包括开源不免费的算法部分。
2022-01-25 19:05:27 210.59MB cuda vs2022 vc17 gtx1060
1