DNN-CNN-and-RNN的语音去噪程序
2021-11-04 13:01:10 10.65MB tensorflow
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
卷积神经网络代码Matlab 人工神经网络 使用空间光谱深度残差卷积神经网络(HSID-CNN)的用于高光谱图像降噪的Matlab演示代码,IEEE TGRS,2019。 By Qiang Zhang (whuqzhang@gmail.com) Wuhan University, China. 如果您在工作中使用/适应我们的代码(作为独立工具或任何算法的组成部分),请引用我们的论文。 Q. Yuan,Q. Zhang,J。Li,H。Shen和L. Zhang ,“使用空间光谱深度残差卷积神经网络进行高光谱图像降噪”, IEEE地理科学与遥感学报,第1卷。 57号2,第1205-1218页,2019年。 @ARTICLE{yuan2019, author={Q. {Yuan} and Q. {Zhang} and J. {Li} and H. {Shen} and L. {Zhang}}, journal={IEEE Trans. Geosci. Remote Sens.}, title={Hyperspectral Image Denoising Employing a Spatial
2021-11-04 10:35:55 11.3MB 系统开源
1
VGG16权重文件vgg16_weights_tf_dim_ordering_tf_kernels.h5的百度网盘下载链接,文件较大从GitHub国内下载速度很慢要两个小时,提供网盘资源需要请下载。
2021-11-04 09:02:34 71B 深度学习 VGG 卷积神经网络 CNN
1
Python语言 DCGAN代码包 完整代码 卷积生成式对抗网络
2021-11-03 12:11:38 38.74MB python GAN CNN DCGAN
1
Android基于卷积神经网络的数字手势识别安卓APP,识别数字手势0-10 Android studio编译,项目有源码和apk,参考链接:https://blog.csdn.net/babyai996/article/details/121196044
2021-11-03 12:01:13 68.81MB android cnn
共同近邻(CNN)聚类 笔记 该项目目前处于Alpha状态。 将来可能会更改实现。 检查示例和文档以获取最新信息。 集群 所述cnnclustering Python包提供了一个灵活的接口聚类算法使用C ommon-Ñearest-Ñeighbours。 虽然该方法可以应用于任意数据,但此实现是在“分子动力学”模拟的处理轨迹背景之前完成的。 在这种情况下,聚类结果可以作为构建核心集马尔可夫状态(cs-MSM)模型的合适基础,以捕获潜在分子过程的基本动力学。 有关用于cs-MSM估计的工具,请参考此单独的。 该软件包提供了一个主要模块: cnnclustering :(等级)共同近邻聚类和分析 特征: 灵活:可以对不同输入格式的数据集进行聚类。 易于与外部方法连接。 方便:功能集成,在分子动力学的背景下非常方便。 快速:核心功能使用Cython。 请参考以下论文以获得科学背景(如
2021-11-02 20:15:45 23.49MB JupyterNotebook
1
bp网络代码 matlab 这是BP和CNN网络的matlab实现。 这些代码用于简单的人工神经网络。
2021-11-02 17:47:50 21.61MB 系统开源
1
介绍 该数据集包含来自10个类别的城市声音的8732个标记的声音摘录(<= 4s):空调,汽车喇叭,儿童玩耍,狗吠,钻探,enginge_idling,gun_shot,手提钻,警笛和street_music。 这些类别是根据城市声音分类法得出的。 有关数据集及其编译方式的详细说明,请参阅我们的论文。 所有摘录均取自上传到现场录音。 这些文件已预先排序为十折(名为fold1-fold10的文件夹),以帮助复制和比较上面文章中报告的自动分类结果。 除声音摘录外,还提供了一个CSV文件,其中包含有关每个摘录的元数据。 数据集链接-https: 方法 1.有3种基本方法可以从音频文件中提取特征:a)使用音频文件的mffcs数据b)使用音频的频谱图图像,然后将其转换为数据点(就像对图像所做的那样)。 使用Librosa的mel_spectogram函数可以轻松完成此操作。c)结合两个功能以构建
2021-11-02 15:14:51 387KB JupyterNotebook
1
matlab精度检验代码3dcnn.torch 使用Torch实现对3D数据进行对象分类的体积CNN(卷积神经网络)。 介绍 这项工作是基于我们的。 我们的论文也将成为CVPR 2016的关注焦点(有关最新结果,请参考arXiv之一)。 在此存储库中,我们发布代码,这些数据用于训练3D数据(二进制体积)上的用于对象分类的体积CNN。 引文 如果您发现我们的工作对您的研究有用,请考虑引用: @article{qi2016volumetric, title={Volumetric and Multi-View CNNs for Object Classification on 3D Data}, author={Qi, Charles R and Su, Hao and Niessner, Matthias and Dai, Angela and Yan, Mengyuan and Guibas, Leonidas J}, journal={arXiv preprint arXiv:1604.03265}, year={2016} } 安装 安装 。 请注意,VolumetricBatch
2021-11-02 14:40:48 1.15MB 系统开源
1