嵌入式CNN
使用SDSOC和Xilinx Ultrascale +平台在嵌入式OS中部署CNN加速器。
平台
SDx:2018.1
电路板:Xilinx Ultrascale + ZCU 102
FPGA系统
数据类型:现在只有float16! 工作频率:300MHz 数据运动网络频率:300MHz
版本
转换v0.0:
这个版本需要很长时间(大约11秒)。 由于某些转换层中的参数无法完全加载到片上mem中,因此必须从DDR多次读取它们到FPGA。 因此,在数据通信上花费大量时间。
转换v0.1:
此版本需要9秒钟才能运行转换层。 与conv.v0.0相比,权重缓冲区更大,可以将更多权重读取到片上mem中。 对于conv1 / conv2 / conv3,所有权重都可以一次加载到片上mem中。 对于conv4 / conv5,权重缓冲区一次只能读取1/4权重。 因此,在conv
2021-11-23 20:10:08
80KB
C++
1