数据集样本数量为5870,所有图片已标注为YOLO txt格式,划分为训练集、验证集和测试集,能直接用于YOLO算法的训练。可用于YOLO3d打印缺陷检测模型训练,机器学习,深度学习,人工智能,python,pycharm。
2024-03-13 16:21:35 233.88MB 数据集 缺陷检测 3d打印 深度学习
1
这些文档主要介绍了深度学习模型中的一些关键组件,包括自注意力机制、前馈神经网络和Transformer模块等。它们适用于需要深入理解这些概念以构建自己的神经网络模型的读者,包括机器学习研究人员、深度学习工程师和学生等。 主要实现了基于Vision Transformer(ViT)的图像分类模型,并进行了相应的改进。首先,通过使用Rearrage层对输入的图像进行重新排列,将其转换为符合Transformer模型输入要求的格式。然后,通过定义PreNorm层、FeedForward层和Attention层等模块,构建了基于ViT的CNN模型(ViTCNN)。其中,PreNorm层用于对输入进行归一化处理,FeedForward层用于进行前向传播计算,Attention层则用于实现注意力机制。在计算过程中,通过使用sin-cos位置编码(posembsincos)方法,将图像的位置信息转化为可学习的参数,提高了模型的泛化能力。最后,通过GRU层对特征进行进一步的处理和融合,得到最终的分类结果。 该模型具有较好的精度和效率,可广泛应用于图像分类任务。但是,该模型仍存在一些可以改进的地方,例如
2024-03-11 20:23:29 3.37MB 深度学习 人工智能 图像分类
1
公路车辆机器学习深度学习样本1500个,包括车头、车尾、侧面的车辆照片,尺寸为128*64
2024-03-11 12:25:35 15.47MB 机器学习 深度学习 车辆样本
1
资源包含102种花卉的分类图片数据集,共8189张图片,可用于深度学习模型的训练。
2024-03-09 12:26:48 329.24MB 数据集 深度学习
1
利用ViT模型实现图像分类,本项目具有强大的泛化能力,可以实现任何图像分类任务,只需要修改数据集和类别数目参数。这里采用的是开源的“猫狗大战”数据集,实现猫狗分类。 本项目适用于Transformer初学者,通过该实践项目可以对于ViT模型的原理和结构有清晰地认识,并且可以学会在具体项目中如何运用ViT模型。本项目代码逻辑结构清晰,通俗易懂,适用于任何基础的学习者,是入门深度学习和了解Transformer注意力机制在计算机视觉中运用的绝佳项目。
1
深度学习图像分类数据集 脑PET图像分析和疾病预测挑战赛%2F脑PET图像分析和疾病预测初赛数据 可以用来训练自己的模型
2024-03-07 19:12:28 18.55MB 深度学习 数据集 图像分类
1
主要语言:TypeScript 项目分类:[AI] 项目标签:[深度学习] [图像工具箱] 推荐理由:一个支持拖拽屏幕截图并将其转换为干净的HTML/Tailwind/JS代码。这个工具可以帮助开发者快速地将设计图转化为可用的前端代码,提高开发效率。
2024-03-07 18:11:18 491KB typescript typescript 人工智能 深度学习
1
基于spring boot + maven + opencv 实现的图像深度学习Demo项目,包含车牌识别、人脸识别、证件识别等功能,贯穿样本处理、模型训练、图像处理、对象检测、对象识别等技术点
2024-03-06 11:37:13 121.71MB 人工智能
深度学习热力图绘制代码,例如,CNN、VIT、Swin等模型,能直接使用。CAM又叫类别激活映射图,也被称为类别热力图、显著性图等。是一张和原始图片等同大小图,该图片上每个位置的像素取值范围从0到1,一般用0到255的灰度图表示。可以理解为对预测输出的贡献分布,分数越高的地方表示原始图片对应区域对网络的响应越高、贡献越大。利用可视化的信息引导网络更好的学习,例如可以利用CAM信息通过"擦除"或""裁剪""的方式对数据进行增强;利用CAM作为原始的种子,进行弱监督语义分割或弱监督定位。
2024-03-06 09:56:14 310KB 深度学习
1
包括缺陷图,掩模图,以及标签
2024-03-05 10:40:37 409.64MB 深度学习 图像识别
1