摘要:通过使用Achronix Speedster7t FPGA中的机器学习加速器MLP72,开发人员可以轻松选择浮点/定点格式和多种位宽,或快速应用块浮点,并通过内部级联可以达到理想性能。  神经网络架构中的  之一就是卷积层,卷积的  基本操作就是点积。向量乘法的结果是向量的每个元素的总和相乘在一起,通常称之为点积。此向量乘法如下所示:  图 1 点积操作  该总和S由每个矢量元素的总和相乘而成,因此  本文讲述的是使用FP16格式的点积运算实例,展示了MLP72支持的数字类型和乘数的范围。  此设计实现了同时处理8对FP16输入的点积。该设计包含四个MLP72,使用MLP内部的级联路径连
1