深度学习基于ZYNQ的卷积神经网络硬件加速器项目系统源码。一个非常完整的项目
运行流程
在Lenet5文件夹中训练并测试卷积神经网络。
量化神经网络并测试效果,最后导出参数。
在custom_ip工程待封装的硬件加速器各BROM IP核中加载刚生成的coe文件。
综合custom_ip中的工程,并导出IP核。
在LeNet5_PSPL工程中导入刚生成的IP核,综合、实现、导出bit流。
运行Xilinx SDK,导入测试图片的标签数据,进行测试。
基于ZYNQ实现了软硬协同的硬件加速器系统,实现对于卷积神经网络识别MNIST手写集的加速。
PL端实现硬件加速器(包括卷积层、池化层、全连接层的实现,缓存区,共享乘累加器)。PS端实现验证测试流程的控制(非常简单的逻辑,就是发送start信号,等待done拉高,读出识别结果,重复200次后计算准确率和耗时。真正软硬协同的PS端应该连上摄像头,然后把摄像头的数据发送过去识别。
测试在开发板上的效果是200张图片,准确率96.5%,耗时47ms。