云端训练:云端即数据中心,对神经网络而言,训练过程就是通过不断更新网络参数,使推断(或者 预测)误差最小化的过程。云端训练对芯片性能的要求很高,主要包括:(1)计算精度,必须支持具有较 长字长的浮点数或定点数;(2)不仅要具有强大的单芯片计算能力,还要具备很好的扩展性,可以通过多 芯片系统提供更强大的计算能力;(3)对内存数量、访问内存的带宽和内存管理方法的要求都非常高; 云端推断:推断过程是指直接将数据输入神经网络并评估结果的正向计算过程。相比训练芯片,推断 芯片考虑的因素更加综合:单位功耗算力,时延,成本等等。终端推断:对于终端推断任务,由于应用场景多种多样,芯片部署在各种设备中,如自动驾
1