CNN的成功依赖于其两个固有的归纳偏置,即平移不变性和局部相关性,而视觉Transformer结构通常缺少这种特性,导致通常需要大量数据才能超越CNN的表现,CNN在小数据集上的表现通常比纯Transformer结构要好。 CNN感受野有限导致很难捕获全局信息,而Transformer可以捕获长距离依赖关系,因此ViT出现之后有许多工作尝试将CNN和Transformer结合,使得网络结构能够继承CNN和Transformer的优点,并且最大程度保留全局和局部特征。 Transformer是一种基于注意力的编码器-解码器结构,最初应用于自然语言处理领域,一些研究最近尝试将Transformer应用到计算机视觉领域。 在Transformer应用到视觉之前,卷积神经网络是主要研究内容。受到自注意力在NLP领域的影响,一些基于CNN的结构尝试通过加入自注意力层捕获长距离依赖关系,也有另外一些工作直接尝试用自注意力模块替代卷积,但是纯注意力模块结构仍然没有最先进的CNN结构表现好。
1
本数据集为摔倒检测数据集,标注格式为VOC 目标检测框,格式XML,数量为1440
1
介紹机器视觉相机与镜头基礎知識,及相關的參數與關系和在機器視覺中的應用
2023-04-21 13:02:40 519KB 机器视觉相机 镜头
1
由于C++语言的运行优势,多数算法模型在实际应用时需要部署到C++环境下运行,以提高算法速度和稳定性 主要讲述WIn10下在VS工程中通过Opencv部署yolov5模型,步骤包括: 1.python环境下通过export.py导出.onnx模型 2.C++环境下通过opencv的DNN模块进行模型导入和调用 部署完成后的检测效果如下图所示(CPU下运行,无加速!) 适合刚开始转战C++的算法小白
2023-04-20 21:31:38 126MB 深度学习 目标检测 YOLO 计算机视觉
1
由于C++语言的运行优势,多数算法模型在实际应用时需要部署到C++环境下运行,以提高算法速度和稳定性 本文主要讲述WIn10下在VS工程中通过Opencv部署yolov5模型,步骤包括: 1.python环境下通过export.py导出.onnx模型 2.C++环境下通过tensorrt进行模型导入和调用,过程中实现int8量化加速 适合刚开始部署模型的小白或者研究者,内附教程
2023-04-20 20:52:45 9.62MB 目标检测 计算机视觉 YOLO 深度学习
1
透镜设计matlab代码
2023-04-20 11:17:56 95.7MB 系统开源
1
计算机视觉方向经典教材,英文原版,彩色
2023-04-19 00:44:09 48.98MB 计算机视觉 英文 彩版
1
这是基于yolo的视觉识别项目,开发语言使用的是C#。资料全部是源代码,完全可以正确运行,适合自己DIY一些小项目使用。
2023-04-18 14:04:25 647.66MB yolo C# 视觉
1
数字图像处理与机器视觉++Visual+C++与Matlab实现 该书的代码,书籍的原版PDF在本人空间的资源中可以找到。 该书对于初学数字图像处理、机器视觉的朋友,帮助颇大,原书的pdf很难找,对应代码,注重实践!加油!
1
视觉系统的基本组成如图1所示。系统一般由3台相互独立的CCD成像单元、光源、图像采集卡、图像处理专用计算机和主控计算机系统等单元组成。为了适应不同元器件,提高视觉系统的精度和速度,把检测对中像机设计成为针对小型Chip元件的小视野高分辨力的照相机CCD1和针对大型IC的大视野低分辨力的照相机CCD2,CCD3为基准定位(MARK点搜寻)照相机。当吸嘴中心到达检测对中像机的视野中心位置时发出触发信号获取图像,在触发的同时对应光源闪亮。   图1 视觉系统硬件示意图   贴片机视觉系统定位示意图如图2所示。当一块新的待贴装PCB通过送板机构传送到指定位置圃定起来,安装在贴片头上的基准(MA
2023-04-15 15:51:36 171KB 贴片机视觉对位系统
1