二维MMSE信道估计算法研究与FPGA实现.docx
2022-05-29 19:07:05 1.42MB fpga开发 算法 文档资料
长期短期记忆(LSTM)广泛用于语音识别。为了获得更高的预测精度,机器学习科学家已经建立了越来越大的模型。这样的大型模型既有计算又有内存密集型。部署这种庞大的模型会导致高功耗,并导致数据中心的所有者总体成本(TCO)较高。为了加速预测并使其高效节能,我们首先提出了一种负载平衡感知修剪方法,可以将LSTM模型大小压缩20倍(修剪10倍,量化2倍),预测精度损失可忽略不计。此外,我们还提出了负载平衡感知修剪,以确保高硬件利用率。接下来,我们提出了一个调度程序,它将压缩模型编码并分区为多个PE以实现并行,并调度复杂的LSTM数据流。最后,我们设计了一个名为ESE的硬件架构,它直接在稀疏LSTM模型上工作。 ESE在运行频率为200MHz的Xilinx XCKU060 FPGA上实现,直接在稀疏LSTM网络上运行282 GOPS,对应密集的2.52 TOPS,处理完整的LSTM,语音识别功耗为41瓦。在语音识别基准的LSTM上进行评估,ESE比Core i7 5930k CPU和Pascal Titan X GPU实现快43倍和3倍。与CPU和GPU相比,它的能效分别提高了40倍和11.5倍
2022-05-29 17:01:18 5.34MB 语音识别
1
本次项目是以Quartus II 9.1和NIOS II 9.1为平台,基于DE2开发板实现。项目具体流程首先通过SD卡将保存的歌曲写入DE2中,通过NIOS II控制,实现LCD,播放器,按键控制等功能的协同工作。
2022-05-28 16:38:25 4.32MB FPGA DEII MP3 Player
1
本文阐述RSA算法中模乘的FPGA实现,从蒙哥马利经典算法,保留进位加法器的蒙哥马利算法、多步运算方式的保留进位加法器的蒙哥马利算法。可以实现任意多步的计算,能够支 持任意素数域的256bit的蒙哥马利算法模乘,较好地降低了完成一次模乘的时钟周期。
2022-05-26 09:00:15 935KB RSA算法的FPGA实现
1
在1月份举办的美国消费电子展(Consumer Electronics Show) 上,数家业界主要的平板电视及显示技术公司纷纷宣布推出高清 3D 电视和令人惊艳的4K x 2K LCD 显示器,从而可将用户家中、车内或移动设备上的电视、显示器以及其他电子设备之间需要交换的数据量显著提升至前所未有的水平。在这些的电视上,体育迷们可以欢欣鼓舞地体验到众多优异性能,如 176 度的超广视界、1,200:1 的超高对比度以及 450尼特的亮度——足以使阴暗的洞穴通透明亮。   不过, 对于开发这些电视或连接至这些电视的电子产品的设计工程师来说,所有这些特性都意味着需要非常高的带宽。例如,一部具备
2022-05-26 04:54:29 246KB 采用FPGA实现 DisplayPort
1
1.例程具有说明文件; 2.例程具有仿真文件; 3.例程使用FPGA实现了二次线性插值算法。
FIR数字滤波器分布式算法的原理及FPGA实现.doc
2022-05-25 09:08:08 341KB fpga开发 文档资料 分布式 算法
利用verilog语言实现串口的发送和接收,以及loopback测试。包含仿真代码。
2022-05-24 19:08:12 9.57MB fpga开发 文档资料
1
输入数据data为8 bit并行数据流,基本结构为数据帧,帧长为10字节,帧同步字为H“FF”。 1、搜索出数据流中的帧同步字信号,并给出帧同步标志。 2、系统工作开始后,要连续3次确认帧同步字进入锁定状态后才输出帧同步标志。 3、在锁定状态时,如连续出现3次错误的帧同步字,则帧同步标志输出无效,系统重新进入搜索状态;否则继续输出有效的帧同步标志。
2022-05-24 15:04:33 694KB FPGA 帧同步
1
数字调制解调技术的MATLAB与FPGA实现(PDF+配套资料)
2022-05-23 19:10:32 389.04MB fpga matlab
1