什么是SIMD SIMD(Single Instruction Multiple Data): 单指令流多数据流) 用一个控制器对一组数据(又称“数据向量”)中的每一个分别执行相同的操作来实现空间上的并行性 典型实例: Intel的MMX或SSE AMD的3D Now!
2022-02-11 20:06:28 428KB SSE体系结构;编程
1
intel SIMD指令参考手册
2022-02-06 15:02:24 388KB IntelSIMD
1
像素点 此回购包含一些有关基本图像处理的单独程序。 它主要是出于个人学习的目的,我将继续编写它们的朴素(纯C)和SIMD(ARM NEON,SSE)优化版本。 随时为该回购创建问题/观看/提出拉取请求。
2022-01-20 19:09:20 15.24MB c neon image-processing C
1
SIMD 基准测试 测试基本矩阵和向量运算与其 SIMD 对应物的相对性能。 每个操作的时间平均超过 10000 次运行。 使用随机单精度浮点数的 4x4 矩阵或 4D 向量。 对 AVX 128 位 (XMM) 和 256 位 (YMM) 寄存器执行的单独计算。 AVX2/FMA3(128 位)指令集(融合乘加)需要 Intel Haswell CPU 。 所有操作都经过了相当大的优化。 SIMD 矩阵乘法使用线性组合方法。 在带有 Intel i5-4278u 2.6 GHz 双核 Haswell CPU 的 2014 rMBP 上进行测试。 操作系统:在 VMWare Fusion 7 上运行的 Windows 8.1。 使用 MSVC++ 2012 编译: x64 mode 、 /arch:AVX 、 /fp:Fast 通过__rdtsc()在 CPU 时钟周期中计时。 (也可以
2021-12-30 21:26:05 10KB C++
1
使用SIMD的C ++图像处理库:SSE,SSE2,SSE3,SSSE3,SSE4.1,SSE4.2,AVX,AVX2,AVX-512,VMX(Altivec)和VSX(Power7),NEON for ARM。 简介Simd库是一个免费的开源图像处理和机器学习库,专为C和C ++程序员设计。 它为图像处理提供了许多有用的高性能算法,例如:像素格式转换,图像缩放和过滤,从图像中提取统计信息,运动检测,对象检测(HAAR和LBP分类器级联)和分类,神经网络。 通过使用不同的SIMD CPU扩展来优化算法。
2021-12-21 10:47:20 4.69MB C/C++ Image Processing
1
SIMD-MC2上的FFT算法 算法描述 n个处理器组成n1/2×n1/2的方阵, 处理器以行主序编号
2021-12-09 18:06:40 8.4MB 并行计算
1
#SSW:SIMD Smith-Waterman的Python包装器 概述 是 Smith-Waterman 算法的快速实现,它使用单指令多数据 (SIMD) 指令在 CPU 级别并行化算法。 这个存储库将 SSW 库包装成一个易于安装的高级 python 接口,没有外部库依赖项。 SSW 库由Mengyao Zhao 和Wan-Ping Lee 编写,这个python 接口由Giles Hall 维护。 安装 要安装 SSW python 包,请使用 pip: $ pip install ssw 示例用法 import ssw aligner = ssw.Aligner() alignment = aligner.align(reference="ACGTGAGAATTATGGCGCTGTGATT", query="ACGTGAGAATTATGCGCTGTGATT") print
2021-12-06 21:49:28 21KB C
1
Simd:使用以下SIMD的C ++图像处理和机器学习库:SSE,SSE2,SSE3,SSSE3,SSE4.1,SSE4.2,AVX,AVX2,AVX-512,VMX(Altivec)和VSX(Power7),NEON臂
2021-11-01 10:35:16 3.93MB c-plus-plus machine-learning arm neural-network
1
MyIntrinsics ++(MIPP) 目的 MIPP是用于用C ++ 11编写的向量固有函数(SIMD)的便携式开放源包装程序(MIT许可证)。 它适用于SSE,AVX,AVX-512和ARM NEON(32位和64位)指令。 MIPP包装器支持简单/双精度浮点数,还支持带符号整数算术(64位,32位,16位和8位)。 使用MIPP包装器,您不再需要编写特定的内部代码。 只需使用提供的功能,包装器就会针对您的特定体系结构自动生成正确的内部调用。 各种各样的 科学出版物 艾德里安·卡萨涅(Adrien Cassagne),奥利维尔·奥马尔(Olivier Aumage),丹尼斯·巴图(Denis Barthou),卡米尔·勒鲁(Camille Leroux)和克里斯多夫·杰戈(ChristopheJégo), , 第五届SIMD /矢量处理编程模型国际研讨会(WPMVP 2018),
2021-10-20 15:42:37 319KB wrapper portable neon vector
1
WebAssembly SIMD 示例 本示例通过 WebAssembly 演示了 JavaScript 中 SIMD 的用法。 它运行了 2 个大小为 10000 的数组相加的 100000 倍(有关更多详细信息,请参阅 )。 第一个实现是通过 JavaScript 中的一个简单循环完成的: for ( let j = 0 ; j < arraySize ; j ++ ) { result [ j ] = a [ j ] + b [ j ] } 第二个实现依赖于以手工编写的 WebAssembly 代码。 这是 SIMD 特定部分(您可以在找到整个代码): (v128.store ( i32 . add (local. get $result ) (local. get $i )) (i8x16.add (v128.load (local. get $i )
2021-10-15 14:25:36 3KB javascript webassembly simd JavaScript
1