介绍 该数据集包含来自10个类别的城市声音的8732个标记的声音摘录(<= 4s):空调,汽车喇叭,儿童玩耍,狗吠,钻探,enginge_idling,gun_shot,手提钻,警笛和street_music。 这些类别是根据城市声音分类法得出的。 有关数据集及其编译方式的详细说明,请参阅我们的论文。 所有摘录均取自上传到现场录音。 这些文件已预先排序为十折(名为fold1-fold10的文件夹),以帮助复制和比较上面文章中报告的自动分类结果。 除声音摘录外,还提供了一个CSV文件,其中包含有关每个摘录的元数据。 数据集链接-https: 方法 1.有3种基本方法可以从音频文件中提取特征:a)使用音频文件的mffcs数据b)使用音频的频谱图图像,然后将其转换为数据点(就像对图像所做的那样)。 使用Librosa的mel_spectogram函数可以轻松完成此操作。c)结合两个功能以构建
2021-11-02 15:14:51 387KB JupyterNotebook
1
matlab精度检验代码3dcnn.torch 使用Torch实现对3D数据进行对象分类的体积CNN(卷积神经网络)。 介绍 这项工作是基于我们的。 我们的论文也将成为CVPR 2016的关注焦点(有关最新结果,请参考arXiv之一)。 在此存储库中,我们发布代码,这些数据用于训练3D数据(二进制体积)上的用于对象分类的体积CNN。 引文 如果您发现我们的工作对您的研究有用,请考虑引用: @article{qi2016volumetric, title={Volumetric and Multi-View CNNs for Object Classification on 3D Data}, author={Qi, Charles R and Su, Hao and Niessner, Matthias and Dai, Angela and Yan, Mengyuan and Guibas, Leonidas J}, journal={arXiv preprint arXiv:1604.03265}, year={2016} } 安装 安装 。 请注意,VolumetricBatch
2021-11-02 14:40:48 1.15MB 系统开源
1
将任何 2D CNN 扩展到 3D CNN,以用于动作识别等研究。 它为 Mathworks 的大多数官方预训练权重模型扩展了多功能性! ( https://ww2.mathworks.cn/matlabcentral/fileexchange/?q=profileid:8743315 )
2021-11-02 14:37:10 6KB matlab
1
深度学习应用在字符识别中,有demo,也有训练代码,支持中文英文的训练,rcnn经典算法,模型小速度快
2021-11-02 11:43:26 69KB 深度学习 字符识别 cnn
1
情感分析分类 先决条件 安装依赖项 pip install -r requirements.txt 安装Spacy英语数据 python -m spacy download en 框架 火炬 数据集 Cornell MR(电影评论)数据集 实施 RNN LSTM 双LSTM LSTM +注意 有线电视新闻网
2021-11-02 09:33:23 6.45MB pytorch lstm rnn bi-lstm
1
一、卷积神经网络 卷积神经网络(ConvolutionalNeuralNetwork,CNN)最初是为解决图像识别等问题设计的,CNN现在的应用已经不限于图像和视频,也可用于时间序列信号,比如音频信号和文本数据等。CNN作为一个深度学习架构被提出的最初诉求是降低对图像数据预处理的要求,避免复杂的特征工程。在卷积神经网络中,第一个卷积层会直接接受图像像素级的输入,每一层卷积(滤波器)都会提取数据中最有效的特征,这种方法可以提取到图像中最基础的特征,而后再进行组合和抽象形成更高阶的特征,因此CNN在理论上具有对图像缩放、平移和旋转的不变性。 卷积神经网络CNN的要点就是局部连接(LocalConn
2021-11-01 22:59:21 66KB c OR test
1
一个画的visioCNN流程和notability自写笔记
2021-11-01 21:01:25 12.95MB CNN
1
CNN_LSTM_CTC_Tensorflow 基于CNN + LSTM + CTC的OCR(光学字符识别)使用张量流实现。 注意:图像中的字符数(可变长度)没有限制。 看一下下面的图像。 我使用此代码训练了一个具有100k图像的模型,并在对测试数据集(200k图像)获得了99.75%的准确性。 两个数据集中的图像: 更新2017.11.6 : 竞争页面现在不可用,如果要重现此结果,请参见有关数据集的,解压缩.tar.gz文件后,标签文件(.txt文件)与图像位于同一文件夹中。 更新2018.4.24 : 更新到tensorflow 1.7并修复问题报告的一些错误。 结构体 图像
2021-11-01 19:17:32 27KB ocr tensorflow cnn lstm
1
卷积神经网络CNN代码解析-matlab.doc,,,,,,,,
2021-11-01 19:09:04 576KB 卷积神经
1