介绍利用GPU加速深度学习算法,涉及模型并行和数据并行,主从模式和令牌环模式通信,满足GPU集群数据划分方法;最后介绍了利用FPGA加速线上识别算法,提高性能功耗比
2023-04-01 15:47:44 539KB 深度学习;GPU
1
随着大数据时代的来临,深度学习技术在从海量数据中提取有价值信息方面发挥着重要作用,已被广泛应用于计算机视觉、语音识别及自然语言处理等领域。本文从深度学习算法的特点和发展趋势出发,分析 FPGA 加速深度学习的优势以及技术挑战;其次,从 SoC FPGA 和标准 FPGA 两个方面介绍了 CPU-FPGA 平台,主要对比分析了两种模型在 CPU 和FPGA 之间数据交互上的区别;接下来,在介绍 FPGA 加速深度学习算法的开发环境基础上,重点从硬件结构、设计思路和优化策略这三个方面详细综述了采用 FPGA 加速卷积神经网络的设计方案;最后展望了 FPGA 加速深度学习算法相关研究工作的发展。
2023-04-01 13:00:52 1.17MB
1
事先声明,标题没有把“Python”错打成“Cython”,因为要讲的就是名为“Cython”的东西。 Cython是让Python脚本支持C语言扩展的编译器,Cython能够将Python+C混合编码的.pyx脚本转换为C代码,主要用于优化Python脚本性能或Python调用C函数库。由于Python固有的性能差的问题,用C扩展Python成为提高Python性能常用方法,Cython算是较为常见的一种扩展方式。 我们可以对比一下业界主流的几种Python扩展支持C语言的方案: 有试用版水印,是因为穷T_T ctypes是Python标准库支持的方案,直接在Python脚本中导入C的
2023-03-31 15:56:48 119KB char char函数 cython
1
LAVA网游加速器是专为各类网游玩家、软件发烧友、网络办公、影音冲浪网虫等个人用户提供网络加速服务的新型产品,能有效减少网络延时,使网络互访再无拥挤的感觉,让您在任何情况下都能体验上网加速的快乐!多地服务器节点可以选择,一个账号即可使用全部节点,随时任意切换,软件自带服务器测速工具,自动选择最快的节点。 本产品不含恶意代码,不读写系统,绝对绿色安全,不监控网络内容,保护用户私隐!使用方便连接之后全网加速不用逐一软件设置代理。 LAVA网游加速器截图
2023-03-30 22:43:19 2.4MB 网络软件-网络加速
1
WIN7_硬件加速
2023-03-30 01:15:54 615KB WIN7_硬件加速
1
一种可配置的CNN协加速器的FPGA实现方法
2023-03-29 21:57:46 2.66MB 一种 可配置 cnn 加速器
1
如题,通过定时器每次都改变脉宽的变化,达到减速或者加速的效果,类似的过程可以用于其他循环中
2023-03-25 15:09:23 2KB 加速脉冲 梯形图
1
针对计算机处理高清图像或视频的边缘检测时存在延时长和数据存储带宽受限的缺点,提出了用Vivado HLS将边缘检测软件代码转换成RTL级硬件电路的硬件加速方法。硬件加速是将运算量大的功能模块由硬件电路实现,根据硬件电路工作频率高和数据位宽自定义,可以解决延时长和数据宽度受限的缺点。实验结果表明,边缘检测硬件加速方法不仅使延时和数据带宽都得到了改善,而且也缩短了边缘检测的开发周期。
2023-03-24 15:24:17 420KB HLS
1
谁用谁知道。懂的能卖钱。 开发吧朋友们。 好人不用谢了
2023-03-22 03:47:55 112KB 全局加速 地下城源码
1
为了提高图像分割的速度和精度,提出了一种新的基于ChanVese水平集模型(CV模型)的梯度加速分割模型。首先,在CV模型的能量函数中加入一个内部能量项,抵消演化过程中水平集函数和符号距离函数的偏差,从而消除分割中周期性重新初始化的过程;其次,提出了梯度加速项,通过感兴趣区域的图像特征,快速得到该区域的边界,且能够提高弱边界的分割精度。实验证明,提出的方法不仅能够加速特定区域的分割、提高分割精度,还能保持分割过程的稳定性。
1