SIFT-GPU A CUDA implementation of SIFT: 配置 (待完成)见SIFT-GPU配置教程 测试 1.Release 模式 cd bin ./SimpleSIFT.exe Release模式,输出结果: [GPU VENDOR]: NVIDIA Corporation 1717MB TEXTURE: 16384 Image size : 800x600 Image loaded : ../data/800-1.jpg Features: 3358 Features MO: 3923 Image size : 640x480 Image loaded : ../data/640-1.jpg Features: 2383 Features MO: 2791 2279 sift matches were
2023-12-15 09:39:08 43.14MB gpu cuda sift
1
这是多维高斯混合模型的期望最大化算法的并行实现,旨在在 NVidia 显卡上运行,支持CUDA。 在我的机器上,它提供高达 170 倍的性能提升(16 个暗淡、16 个集群、1000000 个数据点)。 有关更多信息,请参阅http://andrewharp.com/gmmcuda 上提供的报告。 有趣的代码都在 gpugaumixmod.h 和 gpugaumixmod_kernel.h 中。 参考 CPU 实现位于 cpuaumixmod.h 中。 它可以集成到支持 CUDA 的系统上的任何 C 程序中。 此外,在 gmm.cu 中提供了 Matlab 集成。 自最初发布以来,我添加了同步随机重启。 实验 1 现在利用了这一点。 编译================================================== ====================
2023-03-09 17:44:44 127KB matlab
1
matlab提取文件要素代码CUDA深度神经网络 这是某些深度神经网络(DNN)的实现。 我们密切关注,但是使用C ++ /代替Matlab或Octave。 每个神经网络体系结构都在单独的类中实现,其中一些由其他类组成。 我们已经有了以下架构的工作版本: 稀疏自动编码器(AE) Softmax回归(SM) 堆叠式自动编码器(SAE) 线性解码器(LD)(测试中) 数学 作为参考,我们在此提供每种体系结构的摘要信息。 实际上,我们主要给出了我们在代码中使用的方程式,因此请参阅参考资料以获取完整的说明。 请注意,我们的方程看起来可能与那里的方程并不完全一样,因为我们将给出同时处理大量数据的向量化版本。 但是首先,一些通用的符号: 象征 描述 数据输入大小。 特征向量的维数。 数据列大小。 要训​​练多少个特征向量。 尺寸数据矩阵。 每列都是一个特征向量。 维度的标签向量。 元素包含特征向量的标签。 向量和维度。 这不是单位矩阵。 1和维的矩阵。 这不是单位矩阵。 成本函数中的权重衰减参数。 梯度下降的学习率。 sigmod功能。 可能是什么(实数或矩阵)。 当应用于矩阵时,返回一个向量,该
2023-01-02 01:21:32 12.03MB 系统开源
1
格子玻尔兹曼是一种简单而相对年轻的计算流体动力学方法。 与基于宏观量(质量,动量和能量)守恒的传统计算流体动力学相反,LBM通过在离散晶格网格上传播和碰撞的粒子动力学来对流体进行建模。 由于这种对比,LBM对于数字计算的研究具有许多有趣的优势,例如易于处理复杂的边界和算法的并行化[2]。 下图显示了如何将流体“粒子”表示为离散模型,从而使编写简单明了的建模代码变得毫不费力。 莱迪思·博尔兹曼(Lattice Boltzmann)的模拟我意识到自己只是一个在时间流中虚弱挣扎的人。 但是,我仍然有能力以这样的方式做出贡献:当气体理论得以复兴时,不需要重新发现太多-[Ludwid Boltzmann(* 1844,维也纳,✟in Duino bei Triest)]受启发由Daniel V. Schroeder [1]的原创作品撰写。 格子玻尔兹曼是一种简单而相对年轻的计算流体动力学方法。 与传统相反
2022-11-04 14:41:47 39.97MB C/C++ Artificial Intelligence
1
使用CUDA实现Hough变换,编译环境为VS2005,用到了cuda_vs_wizard进行环境设置,使用OpenCV读入和处理图像并与CUDA的处理结果做比较,这只是一个简单的示例,供入门者学习,程序本身没有做优化。有兴趣的可以做一下优化或在此基础上完成更复杂的图像处理工作
2022-11-04 10:32:14 9.95MB CUDA GPGPU Hough 直线检测
1
CUDA-3D CUDA基础教程 用于3D点云操作,功能工程和基本算法的本机CUDA实现 结构体 ├── operators │   └── README.md ├── README.md └── tutorials ├── hello_world │   ├── coordinating_parallel.cu │   ├── error101.cu │   ├── error_macro.cu │   ├── grid_stride.cu │   ├── hello_world.cu │   ├── loop_accelerate.cu │   ├── Makefile │   ├── matrix_mul.cu │   ├── memory101.cu │   ├── mismatched_c
2022-10-14 16:40:13 13KB Cuda
1
CUDA实现稀疏大矩阵乘法
2022-06-20 13:05:56 3.13MB CUDA
格子Boltzmann模拟 我意识到自己只是一个在时间流中虚弱挣扎的人。 但是我仍然有能力以这样的方式做出贡献:当气体理论复活时,不需要太多的重新发现 -[Ludwid Boltzmann(* 1844,维也纳,✟于Duino bei Triest)] 受到Daniel V. Schroeder 的原创作品的启发。 格子玻尔兹曼是一种简单而相对年轻的计算流体动力学方法。 与基于宏观量(质量,动量和能量)守恒的传统计算流体动力学相比,LBM通过在离散晶格网格上传播和碰撞的粒子动力学来对流体进行建模。 由于这种对比,LBM对于数字计算的研究具有一些有趣的优势,例如易于处理复杂的边界和算法的并行化。 。 下图显示了如何将流体“粒子”表示为离散模型,从而使编写简单明了的建模代码变得毫不费力。 该项目旨在利用算法易于并行化的特性来加速传播,碰撞和弹跳步骤,其中网格的增长对程序运行时间的增长具
2022-06-11 11:58:58 39.97MB C++
1
最小二乘的cuda实现,cuda版本的最小二乘法,节省了时间
2022-03-06 23:21:33 1.69MB 最小二乘 cuda
1
CUDA中PyTorch的软DTW 用于PyTorch的快速CUDA实现。 基于但运行速度最高可提高100倍! forward()和backward()传递都使用CUDA实现。 我的实现部分受到启发,其中提出了基于对角线的Belman递归实现。 入门 此代码取决于和 。 只需在您的项目中包含soft_dtw_cuda.py ,就可以了! 您还可以运行随附的事件探查器/测试(已通过Python v3.6测试),并查看获得的加速效果: git clone https://github.com/Maghoumi/pytorch-softdtw-cuda cd pytorch-softdtw-cuda python soft_dtw_cuda.py 用法示例 脚本中已经提供了示例代码。 这是一个简单的例子: from soft_dtw_cuda import SoftDTW # Crea
2022-01-28 10:40:49 10KB deep-learning cuda pytorch dynamic-time-warping
1