目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来 越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文将对目标检测 领域的发展做一个系统性的介绍,旨在为读者构建一个完整的知识体系架构,同时了解目标 检测相关的技术栈及其未来的发展趋势。由于编者水平有限,本文若有不当之处还请指出与 纠正,欢迎大家评论交流!
2024-03-17 14:47:35 20.83MB 目标检测 深度学习
1
keras进行验证码识别的训练样本集和测试样本集,每个验证码的名称即为验证码显示的字符
2024-03-15 10:20:36 7.79MB keras 人工智能 深度学习 python
1
车辆识别正样本2587个,都是33*33像素的黑白图。 车辆的角度有前有后,无横向位置。 可用opencv进行学习。
2024-03-14 16:38:05 5.1MB 机器学习样本 深度学习样本
1
数据集样本数量为5870,所有图片已标注为YOLO txt格式,划分为训练集、验证集和测试集,能直接用于YOLO算法的训练。可用于YOLO3d打印缺陷检测模型训练,机器学习,深度学习,人工智能,python,pycharm。
2024-03-13 16:21:35 233.88MB 数据集 缺陷检测 3d打印 深度学习
1
这些文档主要介绍了深度学习模型中的一些关键组件,包括自注意力机制、前馈神经网络和Transformer模块等。它们适用于需要深入理解这些概念以构建自己的神经网络模型的读者,包括机器学习研究人员、深度学习工程师和学生等。 主要实现了基于Vision Transformer(ViT)的图像分类模型,并进行了相应的改进。首先,通过使用Rearrage层对输入的图像进行重新排列,将其转换为符合Transformer模型输入要求的格式。然后,通过定义PreNorm层、FeedForward层和Attention层等模块,构建了基于ViT的CNN模型(ViTCNN)。其中,PreNorm层用于对输入进行归一化处理,FeedForward层用于进行前向传播计算,Attention层则用于实现注意力机制。在计算过程中,通过使用sin-cos位置编码(posembsincos)方法,将图像的位置信息转化为可学习的参数,提高了模型的泛化能力。最后,通过GRU层对特征进行进一步的处理和融合,得到最终的分类结果。 该模型具有较好的精度和效率,可广泛应用于图像分类任务。但是,该模型仍存在一些可以改进的地方,例如
2024-03-11 20:23:29 3.37MB 深度学习 人工智能 图像分类
1
公路车辆机器学习深度学习样本1500个,包括车头、车尾、侧面的车辆照片,尺寸为128*64
2024-03-11 12:25:35 15.47MB 机器学习 深度学习 车辆样本
1
资源包含102种花卉的分类图片数据集,共8189张图片,可用于深度学习模型的训练。
2024-03-09 12:26:48 329.24MB 数据集 深度学习
1
利用ViT模型实现图像分类,本项目具有强大的泛化能力,可以实现任何图像分类任务,只需要修改数据集和类别数目参数。这里采用的是开源的“猫狗大战”数据集,实现猫狗分类。 本项目适用于Transformer初学者,通过该实践项目可以对于ViT模型的原理和结构有清晰地认识,并且可以学会在具体项目中如何运用ViT模型。本项目代码逻辑结构清晰,通俗易懂,适用于任何基础的学习者,是入门深度学习和了解Transformer注意力机制在计算机视觉中运用的绝佳项目。
1
深度学习图像分类数据集 脑PET图像分析和疾病预测挑战赛%2F脑PET图像分析和疾病预测初赛数据 可以用来训练自己的模型
2024-03-07 19:12:28 18.55MB 深度学习 数据集 图像分类
1
主要语言:TypeScript 项目分类:[AI] 项目标签:[深度学习] [图像工具箱] 推荐理由:一个支持拖拽屏幕截图并将其转换为干净的HTML/Tailwind/JS代码。这个工具可以帮助开发者快速地将设计图转化为可用的前端代码,提高开发效率。
2024-03-07 18:11:18 491KB typescript typescript 人工智能 深度学习
1