上传者: 42144366
|
上传时间: 2021-10-13 09:14:03
|
文件大小: 12KB
|
文件类型: -
CUDA中最小二乘的共轭梯度
这是用于稀疏矩阵的的CUDA实现。 CGLS解决了问题
minimize ||Ax - b||_2^2 + s ||x||_2^2,
通过使用(CG)。 与仅将CG应用于法线方程相比,它在数值上更稳定。 该实现支持实值和复值矩阵,CSR和CSC格式以及单精度和双精度的任意组合。 另外,可以使用用于计算Ax和A^Tx抽象运算符来代替稀疏矩阵。
####表现
CGLS在Nvidia Tesla K40c上中的两个最大的非平方矩阵上运行。
矩阵名称
尺寸
非零
Iter。
时间
时间/(iter * nnz)
吉安.mesh_grid
(230k,9k)
85万
794
0.52秒
0.77纳秒
JGD_GL7d.GL7d18
(200万,150万)
3600万
77
3.7秒
1.3纳秒
〜U [-1,1]
(1M,950k)
250M