为提高卷积神经网络(CNN)的计算效率和能效,以8bit定点数据作为输入,设计一个支持激活、批标准化以及池化等CNN网络中常见计算类型的卷积加速器,优化循环计算顺序并将其与数据复用技术相结合,以提高卷积计算的效率。基于软硬件协同设计思想,构建包含RISCⅤ处理器和卷积加速器的SoC系统,RISC-V处理器基于开源的指令集标准,可以根据具体的设计需求扩展指令功能。将该SoC系统部署在 Xilinx ZCU102开发板上ISC-V处理器和卷积加速器分别工作在100MHz和300MHz频率下,测试结果表明,该加速器的算力达到53.6GOP/s,运行VGG16网络进行图片推理计算时加速效果较好。
1