该库为 GPU 提供高性能批量稀疏矩阵乘法 (SpMM) 内核。目标矩阵很小,行(或列)数为几十或几百。这种操作可以在图卷积网络的应用中找到。Batched SpMM 算法的详细信息可以在论文 (1) 中找到。
(1) Yusuke Nagasaka、Akira Nukada、Ryosuke Kojima、Satoshi Matsuoka,“用于加速图卷积网络的批量稀疏矩阵乘法”,第 19 届 IEEE/ACM 集群、云和网格计算国际研讨会 (CCGrid 2019),拉纳卡,塞浦路斯,2019 年。(论文也在arXiv上)
2022-06-23 09:05:42
7KB
cuda