音乐流派分类 主题-对音乐所属的流派类型进行分类。 流派包括布鲁斯,古典,乡村,迪斯科,嘻哈,爵士,金属,流行,雷鬼,摇滚。 数据集 数据集为GTZAN。 数据集来自 。 它包含10个班级中的每个班级的100首音乐。 方法 我们将首先将给定的.au音频文件转换为.wav文件。 然后,我们将.wav文件转换为频谱图,然后使用cnn将其分类为不同的组。 通常,频谱图看起来像这样 混淆矩阵 损耗曲线 该模型经过了100个时期的训练,我们可以看到那里存在一些轻微的过拟合现象。 我们选择了能够提供最佳验证精度的模型。 该模型在100个样本中进行了验证,其中10个类别中的每个类别有10个样本,并在900个图像中训练了10个类别中的每个类别的90 准确性 我们使用的模型是微调的VGG16模型。 验证准确性约为73%,培训准确性约为88%。 仅考虑1000个样本,这是一个很好的准确性。 笔记 接受任何进
2021-12-27 20:10:44 1.74GB music cnn gtzan-dataset genre-classification
1
# CNN 深度图人脸_边框回归 ------------------------------------------------------- # 第1步: 制作数据集, data_x , 354*100*100*1, data_y , 354*4 # tricks: 深度图数值归一化[0,1],边框值归一化[0,1],resize(100, 100) # 第2步: 训练CNN,边框回归, IOU损失 # 第3步: 预测数据集 _ bounding-box # 第4步: 保存模型h5,图片提取特征 depth_feature,CNN回归坐标 box_regression
2021-12-27 19:58:03 87.2MB 1、深度图 2、边框回归 3、CNN 4、lasso
1
该存储库包括标签,用于预处理图像数据集的代码以及用于将眼底图像分为五种不同类别的CNN的实现,这些类别分别对应于五个不同级别的糖尿病性视网膜病变(DR)疾病。 项目报告描述了实施情况。 由于数据集过大,因此未在此处上传
2021-12-27 14:05:08 903KB Python
1
项目介绍 该项目基于CNN + BLSTM + CTC实现验证码识别。 该项目仅适用于部署模型,如果您需要训练模型,请转到 知情的 默认的require.txt将安装CPU版本,将“ requirements.txt”从“ TensorFlow”更改为“ TensorFlow-GPU”以切换到GPU版本,使用GPU版本安装相应的CUDA和cuDNN。 demo.py:有关如何调用预测方法的示例。 模型文件夹文件夹用于存储模型配置文件,例如model.yaml。 graph文件夹用于存储编译的模型,例如model.pb 部署服务将自动加载模型配置中的所有模型。 添加新模型配置后,将自动加
2021-12-26 19:06:46 1.39MB ocr tensorflow captcha verification-code
1
使用目标检测的Deep-CNN模型 在这种情况下,使用预训练的卷积神经网络(CNN)MobileNet SSD(单发多盒检测器)模型来检测对象,并通过在对象上方添加一个包含对象名称的框来将对象定位在图像边界内等级和准确性。 mobilenet-ssd模型是旨在执行对象检测的Single-Shot Multibox Detection(SSD)网络。 通过使用SSD,我们只需要单张拍摄即可检测图像中的多个对象。该模型是使用Caffe *框架实现的。 要运行代码,只需运行RUN:python object_detection_image.py或python realtime_object_detection.py
2021-12-26 18:29:14 20.51MB Python
1
深度学习作为一个新的机器学习方向,被应用到计算机视觉领域上成效显著.为了解决分布式的尺度不变特征转换(Scale-Invariant Feature Transform,SIFT)算法效率低和图像特征提取粗糙问题,提出一种基于深度学习的SIFT图像检索算法.算法思想:在Spark平台上,利用深度卷积神经网络(Convolutional Neural Network,CNN)模型进行SIFT特征抽取,再利用支持向量机(Support Vector Machine,SVM)对图像库进行无监督聚类,然后再利用自适应的图像特征度量来对检索结果进行重排序,以改善用户体验.在Corel图像集上的实验结果显示,与传统SIFT算法相比,基于深度学习的SIFT图像检索算法的查准率和查全率大约提升了30个百分点,检索效率得到了提高,检索结果图像排序也得到了优化.
1
微博立场检测是判断一段微博文本针对某一目标话题所表达的观点态度是支持、中立或反对.随着社交媒体的发展,从海量的微博数据中挖掘其蕴含的立场信息成为一项重要的研究课题.但是现有的方法往往将其视作情感分类任务,没有对目标话题和微博文本之间的关系特征进行分析,在基于深度学习的分类框架上,扩展并提出了基于Bert-Condition-CNN的立场检测模型,首先为提高话题在文本中的覆盖率,对微博文本进行了主题短语的提取构成话题集;然后使用Bert预训练模型获取文本的句向量,并通过构建话题集和微博文本句向量之间的关系矩阵Condition层来体现两个文本序列的关系特征;最后使用CNN对Condition层进行特征提取,分析不同话题对立场信息的影响并实现对立场标签的预测.该模型在自然语言处理与中文计算会议(NLPCC2016)的数据集中取得了较好的效果,通过主题短语扩展后的Condition层有效地提升了立场检测的准确度.
2021-12-25 21:20:30 1.37MB 立场检测 主题短语 关系矩阵 句向量
1
基于tensorflow+CNN的搜狐新闻文本分类-附件资源
2021-12-25 18:06:27 106B
1
快速R-CNN的简单快速实现 1.简介 [更新:]我将代码进一步简化为pytorch 1.5,torchvision 0.6,并用来自torchvision的ops roipool和nms替换了自定义的ops roipool和nms。 如果您想要旧版本的代码,请检出分支 该项目是基于和其他的简化的快速R-CNN实现。 我希望它可以作为那些想了解Faster R-CNN详细信息的人的入门代码。 目的是: 简化代码(简单胜于复杂) 使代码更直接(扁平比嵌套更好) 匹配报告的性能(速度计数和mAP问题) 它具有以下功能: 它可以作为纯Python代码运行,不再需要构建事务。 这是在大约2000行有效代码中的最少实现,其中包含大量注释和说明。(由于chainercv的出色文档) 与原始实施相比,它实现了更高的mAP(0.712 VS 0.699) 它可实现与其他实现方式相当的速度
2021-12-25 17:34:23 1.98MB JupyterNotebook
1
cnn垃圾分类的神经网络模型
2021-12-24 12:08:02 81.42MB cnn
1