使用matlab编写语音识别项目,可以识别说出来的yes或者no。可以进行实验,也可以在我的项目之上进行改进和改善。
2021-11-05 19:31:05 1.56MB MATLAB 语音识别
1
电动装置-基于语音识别的电子雷管操作控制装置及方法.zip
2021-11-05 17:01:32 489KB
spoken_numbers_pcm
2021-11-05 10:30:40 37.71MB 语音识别 数据集
1
【语音识别】基于MFCC和SVM的特定人性别识别matlab源码.md
2021-11-04 19:51:16 4KB 算法 源码
1
嘿,杰森! 自动语音识别推理 布莱斯·沃克(Brice Walker) 该项目在Keras / Tensorflow中构建了一个可扩展的,基于注意力的语音识别平台,以便在Edge上针对AI的Nvidia Jetson嵌入式计算平台进行推理。 自动语音识别的这种实际应用是受我以前在心理健康领域的职业启发的。 该项目开始了为构建实时治疗干预推断和反馈平台的旅程。 最终目的是构建一个工具,该工具可以为治疗师提供有关其干预效果的实时反馈,但是设备上的语音识别在移动,机器人或其他不希望基于云的深度学习的领域中具有许多应用。 该项目的重点是应用数据科学而不是学术研究。 最终的生产模型由一个深度神经网络组成,该网络具有3层扩张的卷积神经元,7层双向递归神经元(GRU细胞),一个单注意层和2层时间分布的密集神经元。 该模型利用了CTC损失函数,Adam优化器,批量归一化,扩张卷积,递归辍学,双向层和基于注意的机制。 该模型在Nvidia GTX1070(8G)GPU上进行了30个时期的训练,总训练时间约为6.5天。 该模型的预测与测试集中的地面真实转录的整体余弦相似度约为78%(验证集中为80%)
2021-11-04 17:57:23 1.87GB css python html flask
1
TIMIT Acoustic Phonetic Continuous Speech Corpus 是一个英语语音识别数据,包括 630人8个不同地区的美国方言录制的音频信息。
2021-11-04 16:23:12 416.07MB 语音识别 音频语料
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
1.概述 WTK6900G-24SS为本地语音触发引擎的辨识芯片,具有低成本、高可靠性、通用性强的特点。在语音技术上实现了高可靠的唤醒识别率、更远距离的唤醒、更低误唤醒率、更丰富的语音控制指令条数、更强的抗噪音能力、更快的响应识别时间,免联网的纯离线识别。主要应用在智能家电(白电、厨电、生活电器、小家电等)智能卫浴、智能照明、智能机电、智能家居、酒店客控等
1
离线识别中文语句,使用Android studio工具和自己的安卓手机,需要在手机里面给这个软件的储存和录音权限,到2021/11/2日程序可以正常运行。
2021-11-04 09:01:19 186.66MB 压缩包
1
在matlab上的dtw语音识别算法。对10个语音进行测试,可以直接使用。很好的matlab上的dtw程序
2021-11-03 22:20:47 237KB matlab dtw 语音识别
1