(4)其他提升
SPARSE BLAS:
压缩稀疏矩阵行格式的稀疏矩阵矢量乘法例程的性能提高了 20-50%。以下函数受到影响:
mkl_dcsrgemv、mkl_dcsrsymv 和 mkl_dcsrmv。
Asin 和 Acos 函数的性能提高了 5 - 20%
FFT:
2 的幂的大小大于 17 的单双精度 1 维复数 FFT 的性能最多提高了 40%
在 64 位模式下运行的英特尔(R) 64 位架构系统上,1 维实数的 FFT 在 n = 2、4、8、16、
32 或 64 时最多提高了 3 倍
VML:
通过 OpenMP 的自动线程处理,函数可利用多处理器系统(矢量长度为 n > 200),以及支
持英特尔超线程技术的系统(矢量长度为 n > 10000)。在双核处理器和双处理器系统上,
系统性能最多提高了 90%
1