口语数字识别 :studio_microphone: LSTM语音数字识别 内容 概述 语音数字识别是一个隔离的单词识别系统,可转录0-9之间的各个语音号码。 数据集 使用免费语音数字数据集(FSDD)来训练该模型,该模型具有来自3位讲英语且带有重音的扬声器的1,500张录音。 该模型接受了1,470张唱片的训练,并在30张唱片上进行了测试。 模型与训练 该模型包括: LSTM层 全连接层 损失函数:分类交叉熵 优化算法:亚当 模型在300个时代进行了训练。 改进和要添加的功能 数据集需要更多不同类型的发言人,包括不同性别和不同口音的人,以便该系统在世界范围内正常运行 模型本身可以改进 使用更好的培训/测试策略 具有使用自己的声音来测试模型的界面,使前端易于与模型进行交互 改善模型性能 基本上,这是我的实验,旨在了解如何构建仅检测语音数字的语音识别系统。 用法 python spoke_digit.py为了运行
1
四个机器学习实验,主要涉及简单的线性回归、朴素贝叶斯分类器、支持向量机、CNN做文本分类,内附实验指导书、讲解PPT、参考代码 1、实验讲解PPT 4份 实验一 线性回归模型实验指导 实验二 支持向量机模型实验指导 实验三 贝叶斯分类解决西瓜问题 实验四 基于tensorflow实现CNN文本分类 2、实验指导书 4份 实验一 线性回归实验指导书 实验二 支持向量机实验指导书 实验三 贝叶斯分类实验指导书 实验四 基于tensorflow实现cnn文本处理实验指导书 3、实验参考代码 4份 实验一 LinearRegression 实验二 SVM 实验三 bayes_classify_demo 实验四 cnn-text-classification-tf
2022-05-01 12:05:44 4.63MB 机器学习 线性回归 支持向量机 cnn
1 绪论 2 1.1 字符识别概述 2 1.2 数字识别研究的目的及意义 2 1.3 手写数字识别的典型应用 3 1.4 国内外研究现状 4 1.5 手写体数字识别系统概述 5 1.6 本文内容安排 6 2 手写体数字识别中预处理技术 7 2.1 图像灰度化 7 2.2 图像二值化 8 2.3 图像反色 9 2.4 图像去噪声 10 2.5 数字分割 11 2.5 数字归一化 11 2.5 数字细化 13 3 手写体数字识别中特征值提取技术 16 3.1 特征提取概述 16 3.2 手写体字符特征提取方法概述 18 3.3 手写体数字识别中的结构特征提取 19 3.4 手写体数字识别中的统计特征提取 20 4 人工神经网络分类器 21 4.1 人工神经网络概述 21 4.2 BP神经网络概述 21 4.3 本文的神经网络结构设计 21 5 系统实现与结果分析 24 5.1 系统实现 24 5.1.1 系统实现环境 24 5.1.2 系统处理流程图及主要工作 25 5.1.3 系统界面 26 5.2 结果分析 26 6 结束语
2022-05-01 09:06:42 345KB matlab cnn 源码软件 开发语言
DoubleU-Net:用于医学图像分割的深度卷积神经网络 DoubleU-Net以VGG19作为编码器子网开始,其后是解码器子网。在网络中,输入图像被馈送到修改后的UNet(UNet1),后者会生成预测的蒙版(即output1)。然后,我们将输入图像与生成的蒙版(即output1)相乘,该蒙版用作第二个修改的U-Net(UNet2)的输入,该第二个U-Net(UNet2)生成另一个生成的蒙版(output2)。最后,我们将两个掩码(输出1和输出2)连接起来,以获得最终的预测掩码(输出)。 请在此处找到论文: ,Arxiv: 建筑学 数据集: 本实验使用以下数据集: MICCAI 2015细分挑战赛(用于培训的CVC-ClinicDB和用于测试的ETIS-Larib) CVC诊所数据库 病变边界分割挑战/ li> 2018数据科学碗挑战赛 超参数: 批次大小= 16 纪元数= 300
1
音乐信息检索 音乐结构分割代码 自带下载原始数据程序 提取特征MFCC,Fbank Log-specgram、 CNN-LSTM 使用SALAMI数据集,包含linux下代码和程序文档。
2022-04-30 15:06:21 15.02MB python CNN-lstm
1
北邮自动化+机器学习+实验+卷积神经网络+yhh+作业居多的老师+可直接运行提交
2022-04-30 13:06:13 1KB 北邮自动化 机器学习 CNN 实验作业
深度学习进行物体检测的鼻祖论文,学习目标检测的经典文献,中英文对照翻译。。。
2022-04-29 23:15:31 4.88MB 深度学习 faster r-cnn
1
基于LSTM神经网络的城市交通客流量的预测.zip 大学生课程设计 基于lstm的课程设计 自己大二写的课程设计
2022-04-29 21:06:26 50KB 神经网络 lstm 综合资源 人工智能
关于数据 请参考YOLO-V3-Tensorflow 1. 训练模型前的准备 A.数据准备 数据的标注仍然采用VOC格式的数据标注形式,如果是其他的标注形式比如COCO请自行实现相关代码。将数据最终转化为如下形式: # 单行数据的结构: (path_filename, x1, y1, x2, y2, class_name) # Note: # 一个path_filename 可能对应多个类别(class_name),每个类别占用一行数据 # x1, y1, x2, y2 是原图像的坐标, 而不是ratio后图像上的坐标 # (x1, y1) 标注框的左上坐标; (x2, y2) 标注框的右下坐标 # x1,y1------------------- # | | # | | # | |
2022-04-29 21:06:24 5.46MB keras python
1:包含图像预处理,车牌倾斜校正,车牌过滤、车牌字符分割,车牌字符识别。 2:压缩包包含代码与数据集 3:代码包含基于CNN的车牌过滤训练,字符识别训练,生产模型。 4:主程序进行图像预处理和车牌识别
2022-04-29 21:06:10 247.02MB python tersonflow opencv CNN
1