FT-BLAS:具有在线容错功能的高性能BLAS实现
文件组织
为了便于阅读,我们将每个子例程放在单独的文件夹中。 我们上传了6种双精度的Level-1 BLAS例程:DDOT,DAXPY,DNRM2,DSCAL,DROT,DROTM,3种Level-2的BLAS例程:DGEMV,DGER,DTRSV和4种Level-3的BLAS例程进行了测试。
硬件和软件要求
硬件:Intel Xeon Skylake或Cascade Lake处理器。
软件:Intel icc编译器-更新为能够编译SIMD内部函数和AVX512汇编代码。
您可能需要通过键入以下chmod +x xxx.sh使提供的shell脚本可执行: chmod +x xxx.sh然后再运行其中任何一个。
在测试之前,请务必设置线程号并从终端发送AVX-512指令。
export MKL_ENABLE_INSTRUCTION
2021-09-06 09:49:21
183KB
C
1