工程流程 本文档实现了R-CNN算法进行目标检测的完整过程,包括 数据集创建 卷积神经网络训练 分类器训练 边界框回归器训练 目标检测器实现 本仓库最终实现一个汽车类别目标检测器 模块构成 区域建议生成:selectivesearch算法实现,生成类别独立的区域建议 特征提取:卷积神经网络AlexNet实现,从每个区域建议中提取固定长度的特征向量 线性SVM实现,输入特征向量,输出每类成绩 使用类指定的边界框回归器计算候选建议的坐标偏移 非最大抑制方法实现,得到最终的候选建议 关于区域建议算法selectivesearch实现,在训练阶段使用高质量模式,在测试阶段使用快速模式
2023-03-24 10:34:13 994.85MB pytorch实现R-CNN目标
1
先决条件: nltk(TweetTokenizer) 凯拉斯张量流麻木科学的gensim(如果您使用的是word2vec) itertools 克隆存储库: git clone :AniSkywalker / SarcasmDetection.git cd SarcasmDetection / src / 您可以在以下链接中找到经过训练的模型文件 在/ resource / text_model / weights /中下载经过训练的模型 运行脚本: python sarcasm_detection_model_CNN_LSTM_DNN.py 如果要使用自己的数据训练模型,可以将“训练,开发
2023-03-20 21:21:46 3.17MB twitter keras cnn lstm
1
对 Deep convolutional network cascade for facial point detection[CVPR13]一文的复现,可演示的可执行文件。 目前只实现了第一层。
2023-03-14 22:14:38 8.61MB 深度学习 deep learning 人脸标注
1
注意力机制(英語:attention)是人工神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重,同时减弱其他部分的权重,以此将网络的关注点聚焦于数据中最重要的一小部分。数据中哪些部分比其他部分更重要取决于上下文。可以通过梯度下降法对注意力机制进行训练。 类似于注意力机制的架构最早于1990年代提出,当时提出的名称包括乘法模块(multiplicative module)、sigma pi单元、超网络(hypernetwork)等。注意力机制的灵活性来自于它的“软权重”特性,即这种权重是可以在运行时改变的,而非像通常的权重一样必须在运行时保持固定。注意力机制的用途包括神经图灵机中的记忆功能、可微分神经计算机中的推理任务[2]、Transformer模型中的语言处理、Perceiver(感知器)模型中的多模态数据处理(声音、图像、视频和文本)。人类的注意力机制(Attention Mechanism)是从直觉中得到,它是人类利用有限的注意力资源从大量信息中快速筛选出高价值信息的手段。深度学习中的注意力机制借鉴了人类的注意力思维方式,被广泛的应用在自然语言
2023-03-13 22:16:25 14.45MB 深度学习 图像识别 机器学习
1
利用pytorch实现图像分类的一个完整的代码,训练,预测,TTA,模型融合,模型部署,cnn提取特征,svm或者随机森林等进行分类,模型蒸馏,一个完整的代码。 实现功能: 基础功能利用pytorch实现图像分类 包含带有warmup的cosine学习率调整 warmup的step学习率优调整 多模型融合预测,加权与投票融合 利用flask + redis实现模型云端api部署(tag v1) c++ libtorch的模型部署 使用tta测试时增强进行预测(tag v1) 添加label smooth的pytorch实现(标签平滑)(tag v1) 添加使用cnn提取特征,并使用SVM,RF,MLP,KNN等分类器进行分类(tag v1)。 可视化特征层。 转载:https://github.com/lxztju/pytorch_classification
2023-03-11 16:54:10 3.03MB 预测模型 图像分类 pytorch
1
摘要过去几年,在经典数据集PASCAL上,物体检测的效果已经达到一个稳定水平。效果最好的方法是融合了多种低维图像特征和高维上下文环境的复杂集成系统。在这篇论文里
2023-03-09 11:28:12 2.64MB cnn
1
针对实际交通场景下的车辆目标,应用深度学习目标分类算法中具有代表性的Faster R-CNN框架,结合ImageNet中的车辆数据集,把场景中的目标检测问题转换为目标的二分类问题,进行车辆目标的检测识别。相比传统机器学习目标检测算法,基于深度学习的目标检测算法在检测准确度和执行效率上优势明显。通过本实验结果分析表明,该方法在识别精度以及速度上均取得了显著的提高。
1
No More Strided Convolutions or Pooling:A New CNN Building Block for Low-Resolution Images and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv 提出了一个名为SPD-Conv的新的CNN构建块,它完全消除了步长和池化操作,取而代之的是一个空间到深度卷积和一个无步长卷积。
2023-03-08 09:47:30 1.91MB paper
1
资源给大家带来一个利用卷积神经网络(CNN)进行中文OCR识别,实现自己的一个OCR识别工具。 一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,这样可节省人力打字的时间。
2023-03-07 19:34:57 2.34MB OCR 人工智能 卷积神经网络
1
这是一个手把手教你用 Tensorflow 构建卷机网络(CNN)进行图像分类的教程。教程并没有使用 MNIST 数据集,而是使用了真实的图片文件,并且教程代码包含了模型的保存、加载等功能,因此希望在日常项目中使用 Tensorflow 的朋友可以参考这篇教程。 概述 --- • 代码利用卷积网络完成一个图像分类的功能 • 训练完成后,模型保存在 model 文件中,可直接使用模型进行线上分类 • 同一个代码包括了训练和测试阶段,通过修改 train 参数为 True 和 False 控制训练和测试 数据准备 --- 教程的图片从 Cifar 数据集中获取,download_cifar.py 从 Keras 自带的 Cifar 数据集中获取了部分 Cifar 数据集,并将其转换为 jpg 图片。 默认从 Cifar 数据集中选取了 3 类图片,每类 50 张图,分别是 • 0 => 飞机 • 1 => 汽车 • 2 => 鸟 图片都放在 data 文件夹中,按照 label_id.jpg 进行命名,例如 2_111.jpg 代表图片类别为 2(鸟),id 为 111。
2023-03-06 17:25:53 224KB Tensorflow 卷积网络 CNN 图像分类
1