详细解读了卷积神经网络是如何工作的,从CNN卷积层、激活层、池化层到全链接层,及多层CNN作用进行了通熟易懂的讲解
2021-12-28 16:59:53 3.46MB CNN 深度学习
1
第一章回顾了理解卷积神经网络的动机;  第二章阐述了几种多层神经网络 ,并介绍当前计算机视觉领域应用中最成功的卷积结 构;  第三章具体介绍了标准卷积神经网络中的各构成组件 ,并从生物学和理论两个角度分 析不同组件的设计方案 ;  第四章讨论了当前卷积神经网络设计的趋势及可视化理解卷积神经网络的相关研究工 作 ,还重点阐述了当前结构仍存在的一些关键问题
2021-12-28 16:54:12 1.44MB CNN
1
糖尿病视网膜病变竞赛的解决方案 这是Kaggle的竞赛,您的任务是将每个人的眼部检查分类为5种不同程度的糖尿病导致的疾病。 这是我用来处理原始图像的代码的存储库,即卷积神经网络模型(使用keras构建)。 它主要基于论坛中提供的一个基准。 执行以下步骤: 仅使用普通图像处理到256X256,未使用其他方式调整颜色等。 通过增加1、2、3和4类来平衡不同类的图片。 使用过的VGG风格架构,使用开普勒K20c GPU,以10个时期进行训练,批量大小为32。 它运行约2天。 由于输出是有序的(疾病的阶段),因此不作为分类问题运行,而是作为回归问题运行。 将原始输出转换为疾病阶段标签。 天真的,我们可以转换到接近阶段。 但是,根据原始数据集的比例对原始分数进行排名会产生更好的Kappa分数。 最后,该模型在私有数据集上得出的Kappa为0.38,由于辍学,该结果在公共得分上接近0.3
2021-12-28 16:07:35 278KB Python
1
包含cifar10数据集,CNN卷积网络源码,OpenMV IDE2.2,PPT
2021-12-27 21:02:07 430.92MB cifar10数据集 CNN卷积网络源码 OpenMVIDE2.2
1
音乐流派分类 主题-对音乐所属的流派类型进行分类。 流派包括布鲁斯,古典,乡村,迪斯科,嘻哈,爵士,金属,流行,雷鬼,摇滚。 数据集 数据集为GTZAN。 数据集来自 。 它包含10个班级中的每个班级的100首音乐。 方法 我们将首先将给定的.au音频文件转换为.wav文件。 然后,我们将.wav文件转换为频谱图,然后使用cnn将其分类为不同的组。 通常,频谱图看起来像这样 混淆矩阵 损耗曲线 该模型经过了100个时期的训练,我们可以看到那里存在一些轻微的过拟合现象。 我们选择了能够提供最佳验证精度的模型。 该模型在100个样本中进行了验证,其中10个类别中的每个类别有10个样本,并在900个图像中训练了10个类别中的每个类别的90 准确性 我们使用的模型是微调的VGG16模型。 验证准确性约为73%,培训准确性约为88%。 仅考虑1000个样本,这是一个很好的准确性。 笔记 接受任何进
2021-12-27 20:10:44 1.74GB music cnn gtzan-dataset genre-classification
1
# CNN 深度图人脸_边框回归 ------------------------------------------------------- # 第1步: 制作数据集, data_x , 354*100*100*1, data_y , 354*4 # tricks: 深度图数值归一化[0,1],边框值归一化[0,1],resize(100, 100) # 第2步: 训练CNN,边框回归, IOU损失 # 第3步: 预测数据集 _ bounding-box # 第4步: 保存模型h5,图片提取特征 depth_feature,CNN回归坐标 box_regression
2021-12-27 19:58:03 87.2MB 1、深度图 2、边框回归 3、CNN 4、lasso
1
该存储库包括标签,用于预处理图像数据集的代码以及用于将眼底图像分为五种不同类别的CNN的实现,这些类别分别对应于五个不同级别的糖尿病性视网膜病变(DR)疾病。 项目报告描述了实施情况。 由于数据集过大,因此未在此处上传
2021-12-27 14:05:08 903KB Python
1
项目介绍 该项目基于CNN + BLSTM + CTC实现验证码识别。 该项目仅适用于部署模型,如果您需要训练模型,请转到 知情的 默认的require.txt将安装CPU版本,将“ requirements.txt”从“ TensorFlow”更改为“ TensorFlow-GPU”以切换到GPU版本,使用GPU版本安装相应的CUDA和cuDNN。 demo.py:有关如何调用预测方法的示例。 模型文件夹文件夹用于存储模型配置文件,例如model.yaml。 graph文件夹用于存储编译的模型,例如model.pb 部署服务将自动加载模型配置中的所有模型。 添加新模型配置后,将自动加
2021-12-26 19:06:46 1.39MB ocr tensorflow captcha verification-code
1
使用目标检测的Deep-CNN模型 在这种情况下,使用预训练的卷积神经网络(CNN)MobileNet SSD(单发多盒检测器)模型来检测对象,并通过在对象上方添加一个包含对象名称的框来将对象定位在图像边界内等级和准确性。 mobilenet-ssd模型是旨在执行对象检测的Single-Shot Multibox Detection(SSD)网络。 通过使用SSD,我们只需要单张拍摄即可检测图像中的多个对象。该模型是使用Caffe *框架实现的。 要运行代码,只需运行RUN:python object_detection_image.py或python realtime_object_detection.py
2021-12-26 18:29:14 20.51MB Python
1
深度学习作为一个新的机器学习方向,被应用到计算机视觉领域上成效显著.为了解决分布式的尺度不变特征转换(Scale-Invariant Feature Transform,SIFT)算法效率低和图像特征提取粗糙问题,提出一种基于深度学习的SIFT图像检索算法.算法思想:在Spark平台上,利用深度卷积神经网络(Convolutional Neural Network,CNN)模型进行SIFT特征抽取,再利用支持向量机(Support Vector Machine,SVM)对图像库进行无监督聚类,然后再利用自适应的图像特征度量来对检索结果进行重排序,以改善用户体验.在Corel图像集上的实验结果显示,与传统SIFT算法相比,基于深度学习的SIFT图像检索算法的查准率和查全率大约提升了30个百分点,检索效率得到了提高,检索结果图像排序也得到了优化.
1