Fox乘法
分块: 同Cannon分块算法
算法原理
①Ai,i向所在行的其他处理器
进行一到多播送;
②各处理器将收到的A块与原
有的B块进行乘-加运算;
③B块向上循环移动一步;
④如果Ai,j是上次第i行播送的块,本次选择 向所
在行的其他处理器进行一到多播送;
⑤转②执行 次;
A0,0
B0,0
A1,0
B1,0
A2,0
B2,0
A3,0
B3,0
A0,1
B0,1
A1,1
B1,1
A2,1
B2,1
A3,1
B3,1
A0,2
B0,2
A1,2
B1,2
A2,2
B2,2
A3,2
B3,2
A0,3
B0,3
A1,3
B1,3
A2,3
B2,3
A3,3
B3,3
1