颜色分类leetcode xview2 第一名解决方案 “xView2:评估建筑损坏”挑战的第一名解决方案。 解决方案介绍 使用此环境开发的解决方案: Python 3(基于Anaconda安装) Pytorch 1.1.0+ 和 torchvision 0.3.0+ 英伟达顶点 硬件:当前的训练批量大小至少需要 2 个 GPU,每个 GPU 为 12GB。 (最初在 Titan V GPU 上训练)。 对于 1 GPU 批量大小和学习率应该在实践中找到并相应地改变。 竞赛数据集中的“train”、“tier3”和“test”文件夹应放在当前文件夹中。 使用“train.sh”脚本来训练所有模型。 (在 2 个 GPU 上约 7 天)。 要生成预测/提交文件,请使用“predict.sh”。 “evaluation-docker-container”文件夹包含用于对保留集(CPU 版本)进行最终评估的 docker 容器的代码。 训练模型 此处提供经过训练的模型权重: (请注意:代码是在比赛期间开发的,旨在对不同的模型进行单独的实验。因此,按原样发布,没有额外的重构以提供完全的训练重现
2023-04-14 23:10:08 116KB 系统开源
1
颜色分类leetcode 实时交通标志检测和分类 使用 SSD 的新版本将于今年夏天发布,供任何需要更高精度检测方法的人使用。 请继续关注新的更新! 1. 说明 该项目是一个使用 OpenCV 的视频交通标志检测和分类系统。 检测阶段使用图像处理技术在每个视频帧上创建轮廓并在这些轮廓中找到所有椭圆或圆。 它们被标记为交通标志的候选对象。 检测策略: 增加视频帧的对比度和动态范围 使用 HSV 颜色范围去除不必要的颜色,如绿色 使用 Laplacian of Gaussian 显示对象的边界 通过二值化制作轮廓。 检测椭圆形和圆形轮廓 在下一阶段 - 分类阶段,通过基于候选坐标从原始帧中裁剪来创建图像列表。 预训练的 SVM 模型将对这些图像进行分类,以找出它们是哪种类型的交通标志。 当前支持的交通标志(每个标志文件的名称与其在 SVM 中的类相对应): 注意: 所有属于 8 级及以上的标志都被标记为OTHERS,因为比赛需要这样做。 还有一个 0 类被标记为非交通标志 仅对当前帧中最大的标志进行裁剪和分类 每次main.py调用时都会训练 SVM 模型,在检测阶段之前,但我仍然保存模型
2023-04-11 14:56:53 26.78MB 系统开源
1
颜色分类leetcode mlrose:机器学习、随机优化和搜索 mlrose 是一个 Python 包,用于将一些最常见的随机优化和搜索算法应用于一系列不同的优化问题,包括离散值和连续值参数空间。 项目背景 mlrose 最初是为了支持佐治亚理工学院 OMSCS/OMSA 课程 CS 7641:机器学习的学生而开发的。 它包括本课程中教授的所有随机优化算法的实现,以及将这些算法应用于整数字符串优化问题的功能,例如 N-Queens 和背包问题; 连续值优化问题,如神经网络权重问题; 和旅游优化问题,例如旅行商问题。 它还具有解决用户定义的优化问题的灵活性。 在开发时,不存在将所有这些功能集中在一个位置的单个 Python 包。 主要特点 随机优化算法 实现:爬山、随机爬山、模拟退火、遗传算法和(离散)MIMIC; 解决最大化和最小化问题; 定义算法的初始状态或从随机状态开始; 定义您自己的模拟退火衰减计划或使用三种预定义的可自定义衰减计划之一:几何衰减、算术衰减或指数衰减。 问题类型 解决离散值(位串和整数串)、连续值和旅游优化(旅行销售员)问题; 定义您自己的适应度函数以进行优化或
2023-03-28 18:04:17 213KB 系统开源
1
颜色分类leetcode 用于文本的 Grad-CAM 这是文本分类模型的实现。 使用的模型是用于文本分类的 1D-CNN,在 . 使用的数据是重新精炼的版本,其重新标记以进行二元分类。 输入功能是 word2vec 的精简版。 它特别需要 python>=3, tensorflow>=1.4,<2>>> pip3 install -r requirements.txt 特征 在训练之前,它需要 word2vec 二进制文件。 通过word2vec.sh下载,会下载到 word2vec/ 目录下。 >>> ./word2vec.sh 所有 word2vec 二进制文件都必须位于 word2vec/ 目录中。 word2vec/GoogleNews-vectors-negative300-SLIM.bin 训练时会自动下载。 训练 usage: train.py [-h] [--epoch EPOCH] [--batch-size BATCH_SIZE] [--lea
2023-03-21 11:32:51 119KB 系统开源
1
halcon图像分类
2023-03-10 12:36:05 178KB halcon 图像分类
1
时尚物件产品颜色分类图像数据集,共12个颜色分类,每个有300-700不等的图片数据 时尚物件产品颜色分类图像数据集,共12个颜色分类,每个有300-700不等的图片数据 时尚物件产品颜色分类图像数据集,共12个颜色分类,每个有300-700不等的图片数据
2022-12-18 18:28:31 35.89MB 时尚 产品 分类 图像
花朵颜色分类图像数据集,210张图片(128x128x3),包含10种开花植物;带标签的文件flower-labels.csv,图片文件格式为png,标签为整数。分别是:0 =比;夹竹桃;1 =比;玫瑰;2 =比;金盏草;3 =比;虹膜;4 =比;大白菊(沙斯塔雏菊);5 =比;风铃草属植物(风铃草);6 =比;中提琴;7 =比;rudbeckia laciniata (Goldquelle);8 =比;牡丹;9 =比;耧斗菜。
2022-12-12 11:28:51 50.05MB 数据集 花瓣 花朵 分类
颜色分类leetcode 疲劳检测 眼睛状态分类使用 OpenCV 和 DLib 来估计眼睛闭合百分比 (PERCLOS) 并提醒昏昏欲睡的人(例如司机)。 依赖项: ... 1. OpenCV(3.0 或更高版本)... 2. Dlib(19.0 或更高版本,用于面部标记) 使用长/短轴的纵横比 (cpp) 使用 DLib 面部标志检测器来查找眼睛的长轴和短轴以及嘴巴。 长轴和短轴的纵横比用于确定眼睛/嘴巴是否张开; 这允许眼睛状态分类和打哈欠检测。 需要 .dat 文件中的预训练 DLib 面部标志检测器模型。 使用二元阈值 使用 OpenCV Haar Cascade 分类器检测人脸,然后检测人脸边界框内定义的粗糙区域内的眼睛。 眼睛状态分类是通过对肤色的图像进行阈值处理并计算黑色像素的数量来完成的,阈值通过 HSV 直方图针对肤色进行归一化
2022-11-22 21:44:38 553KB 系统开源
1
颜色分类leetcode 交通灯图像分类 Udacity 自动驾驶汽车纳米学位顶点项目。 系统集成 概述 感知子系统对车辆前方的交通灯颜色进行动态分类。 在给定的模拟器和测试站点环境中,汽车面对单个交通灯或一组 3 个处于相同状态(绿色、黄色、红色)的交通灯。 我们假设不可能同时在不同的州有多个交通灯。 我们考虑了不同的方法来解决交通灯分类任务: 使用CNN对整个图像进行分类; 物体(红绿灯状态)检测; 使用单独模型的物体(交通灯)检测和分类。 考虑到红绿灯始终处于相同状态,并专注于创建轻量级和快速模型,我们选择了对整个图像进行分类的方向。 这种方法使用卷积神经网络,它将前置摄像头的整个图像作为输入,并预测交通灯状态(我们决定使用红色/无预测类)作为输出。 我们在 MobileNet 架构上使用了迁移学习技术和 Tensorflow Image Retraining Example(教程:,代码:)。 数据集 有多个数据集可用于模型训练: 来自 Udacity 模拟器的图像(图像以及来自前置摄像头的地面实况可作为 ROS 主题提供); rosbag,在 Udacity 的测试站点上捕获
2022-10-09 15:08:15 81.13MB 系统开源
1
颜色分类leetcode 序列网 血管分割和动脉/静脉分类的联合学习 视网膜成像是诊断各种疾病的宝贵工具。 然而,即使对于有经验的专家来说,阅读视网膜图像也是一项困难且耗时的任务。 自动视网膜图像分析的基本步骤是血管分割和动脉/静脉分类,它们提供有关潜在疾病的各种信息。 为了提高现有的视网膜图像分析自动化方法的性能,我们提出了两步血管分类。 我们采用基于 UNet 的模型 SeqNet 从背景中准确地分割血管并对血管类型进行预测。 我们的模型按顺序进行分割和分类,这减轻了标签分布偏差的问题并促进了训练。 模型 图 1 SeqNet 的网络架构。 用法 训练时,数据集应放置在./data/ALL ,遵循./utils/prepare_dataset.py定义的数据结构。 训练: python train.py 模型将保存在./trained_model/ ,结果将保存在./output/ 。 预言: python predict.py -i ./data/test_images/ -o ./output/ 预训练权重 这是一个用多个数据集训练的模型(DRIVE、LES-AV 和 HRF
2022-09-08 16:33:14 690KB 系统开源
1