只为小站
首页
域名查询
文件下载
登录
学习在kernel态下使用NEON对算法进行加速的方法
主要介绍了学习在kernel态下使用NEON对算法进行加速的方法,一起来学习下,大大提高数据运算的效率。
2023-04-11 09:55:50
1.33MB
kernel
NEON
算法
加速
1
ICP
算法加速
优化-多线程和GPU
ICP
算法加速
优化--多线程和GPU 已成功编译配置: Windows10下环境配置:cmake3.23.3+VS2019+CUDA11.1+PCL1.12.1 Ubuntu20.04(WSL)下环境配置:基于docker镜像cuda11.1-gcc,cmake3.16.3+PCL1.10.0
2022-12-02 09:33:42
1.39MB
icp算法
openmp
cuda
1
基于软加速的海思图像跟踪库
这是一个仅适用于hi3519和hi3516的经过加速处理的图像跟踪库,采用的opencv,但是opencv是重新修改和软加速过的,在hi3519上可以达到20fps的跟踪速率,3516上可以达到14fps。
2022-11-07 17:32:43
11.83MB
目标跟踪
海思3519
嵌入式算法加速
1
Opencl入门学习例子
OPencl入门学习简单例子,完整包含了opencl编程的步骤,可供参看学习。。一个完整的OpenCL加速技术过程涉及到平台(Platform)、设备(Device)、上下文(Context)、OpenCL程序(Program)、指令队列(Command)、核函数(Kernel)、内存对象(Memory Object)、调用设备接口(NDRange),下面将分别进行做简单的介绍,后面也会给出参考资料的相关链接。
2022-05-27 21:49:35
922KB
算法加速
OpenCL加速
并行加速
1
svm支持向量机SMO
算法加速
.py
本程序应用SVM为基础,核函数采用高斯核函数,数据为手写数字数据1和9,用smo加速算法,识别正确率达99.4%,而且我博客有讲解
2022-03-31 16:39:18
21KB
SVM
支持向量机
高斯核函数
smo
1
一种快速高精度的相位恢复迭代法
在传统GS算法的基础上,根据角谱传播理论并引入一简单的梯度,提出一种快速、高精度相位恢复迭代算法--加速角谱迭代法。该算法使用三个面(即一个输入面和两个输出面)的强度信息恢复输入面光场的相位分布。数值模拟结果表明,该算法能在二维情况下快速准确地恢复各种输入面光场的相位分布,并且大幅度地提高了复杂光场的相位恢复精度。在模拟实验中多次选取随机初始迭代值,该算法的收敛结果唯一,表明算法有良好的收敛性能。
2021-12-06 23:31:22
1.72MB
光计算
相位恢复
迭代算法
加速角谱
1
GPU图像加速实现迭代
算法加速
基于GPU图形加速卡,编程实现多线程同步加速,适用于各类图像重建算法,尤其是迭代类计算量比较大的算法。ART,SIRT,SART 等。
2021-11-15 16:07:24
18.27MB
ART
SIRT
2D
3D
1
关于实现Halcon
算法加速
的基础知识(多核并行/GPU)
关于实现Halcon
算法加速
的基础知识 详情:https://blog.csdn.net/libaineu2004/article/details/104202063
2021-10-18 20:39:28
20KB
halcon
gpu
加速
并行
1
基于GPU的LLE
算法加速
及性能优化.pdf
基于GPU的LLE
算法加速
及性能优化.pdf
2021-09-25 19:03:25
1.79MB
GPU
处理器
数据处理
参考文献
DSP中的基于CPU-GPU 异构机群的FDTD 并行
算法加速
研究(一)
摘要:时域有限差分法(FDTD)求解电磁学中麦克斯韦方程组是科学与工程计算中一个非常重要的算法。通过对FDTD 求解麦克斯韦旋度方程的直接时间域的分析,给出其基于多个GPU 组成异构机群系统上的并行加速算法,用OpenCL、CUDA 和MPI 编程模型实现了并行程序。在目前的主流NVIDIA 和ATI 的GPU 平台上,加速的并行FDTD 程序相对CPU 串行程序和8 个CPU 核的MPI 并行程序,分别获得了超过8 倍和1.5 倍的加速,并在多个GPU 卡上获得了接近线性加速的扩展性能。 引言 Maxwell 方程组用数学模型揭示了自然界一切宏观电磁现象所遵循的普遍规律,一百多年
2021-07-14 12:56:39
187KB
DSP中的基于CPU-GPU
异构机群的FDTD
并行算法加速研究(一)
DSP
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
现代操作系统原理与实现.pdf
基于VMD算法的信号降噪.rar
quartus II13.0器件库.zip
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
多目标优化算法(四)NSGA3的代码(MATLAB)
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
中国地面气象站观测数据2000-2021
pytorch实现RNN实验.rar
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
MAC OS.X.10.8.iso 镜像文件
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
银行笔试 信息科技岗部分真题
中国地面气候资料日值数据集(V3.0)2014-2019.zip
2019年秋招—华为硬件工程师笔试题目.pdf
最新下载
奇妙三数字软件免费版 破解版
Grain v1算法描述文档、C语言实现源程序及标准测试向量
PSIM Buck闭环仿真 扫频运用
基于Comsol的MPCVD装置与等离子体沉积刻蚀仿真技术研究:H2放电低气压下的MPCVD放电特性分析,comsol 等离子体仿真 mpcvd装置仿真,H2放电低气压mpcvd放电,等离子体沉积刻蚀
INTEL Parallel Studio XE 2016 With Updates License
驱动开发实用工具,驱动加载,链接符号查看工具
ciku3.txt,拼音词组单字词库,带词频。
SKTOOLV7.0.0.69_setup(20201230).rar
解析华为手表表盘hwt watchface包中的素材
GitKrakenSetup-6.5.1
其他资源
Qt中将QTableView中的数据导出为Excel文件实例
红外与可见光图像融合实验素材
Edmonds算法Python版
反编译易语言
电子科技大学算法分析与设计课件课件以及考试试卷平时作业集合.rar
HP GEN8 ILO2.55固件+中文语言包
jsp简单注册,登录页面
基于altera FPGA 的 UART IP核
DVB-S2译文.docx
U盘版免卡免狗 PC3000 V14中文破解版
kafka_2.11-0.10.0.0.tgz
基于C#的简易画板
基于SSH的任务调度系统的设计与实现.rar
jetson_xavier_AGX:ROS开发-主节点
2017-2020年重庆大学334新闻与传播专业综合能力考研真题
Java选取RGB颜色Color.jar
传感器实验报告.doc
配谢处方、杨显清的《电磁场与电磁波》(第4版)
VS 代码行数统计插件
6s大气纠正范例 和Matlab计算源码
Oracle+PLSQL+语法手册 全面 详细 chm
IOS汤姆猫素材
模糊控制 经典教材 很好 很强大
DesigningData-IntensiveApplications_高清PDF-算法与数据结构文档类资源