0-9数字语音库(各300段语音数据) 采样率:fs=16000Hz,采样精度:16bit,单通道。录音软件:Cool Edit Pro 2.1 数据命名说明:文件夹i表示数字i的样本。 ij.wav表示第i个人的第j个样本。 第1 个人为A,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.20晚录。 第2 个人为B,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.20晚录。 第3 个人为C,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.21晚录。 第4 个人为D,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.21晚录。 第5 个人为E,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.20晚录。 第6 个人为F,每个数字10个样本,分别存放在各个数字命名的文件夹中。2016.9.21晚录。
2022-04-19 10:05:35 44.35MB 语音识别 语音数据 数字语音数据
1
语音识别matlab代码详解语音识别系统开发生命周期 阶段 规划: 定义系统的范围 根据说话者的语音样本识别说话者。 可行性研究 估算成本 该项目在特定语音样本不被篡改或说话者试图模仿其他声音的范围内是可行的。 这是一个完全在软件上完成的简单项目,因此除了时间之外没有其他成本。 但是,如果我们尝试基于此实现构建硬件设备,成本部分就会出现。 分析: 定位现有缺陷 语音识别技术已经取得了很多进步,但仍有很大的发展空间。 基于语音的设备在我们的日常生活中找到了它们的应用,并且特别对那些患有某种残疾的人有巨大的好处。 定义要求 基于语音的设备在我们的日常生活中找到了它们的应用,并且特别对那些患有某种残疾的人有巨大的好处。 我们还可以将这些基于语音的设备用于安全措施,以减少欺诈和盗窃案件。 高级要求 MATLAB 编码,分析语音信号的基本理解。 低级要求 了解 MFCC 特征提取过程。 高级设计: 低级设计: 文件夹结构 文件夹 描述 1 Requirements 对项目的必要了解 2 Architecture 详细实施流程 3 Implementation Matlab 代码文件 4 Test
2022-04-18 14:10:37 3.13MB 系统开源
1
自动语音情感识别器(SER)是目前具有广泛的应用人机交互(HCI)领域的研究课题。语音特征,如Mel频率倒谱系数(MFCC )和梅尔能谱动态系数(本中心) ,都是从言语交流中提取的。支持向量机(SVM)作为分类器对柏林情绪数据库中的不同情绪状态进行分类,如愤怒,快乐,悲伤,中性,恐惧。 LIBSVM是用于情绪的分类。性别无关的情况下给出了93.75%的分辨率,男性语音94.73% 和女性语音的100 % 。
2022-04-17 22:12:28 134KB svm;语音识别
1
基于SDC特征和GMM-UBM模型的语种识别系统,徐婷婷,,本文提出了一种基于SDC特征和改进的GMM-UBM 模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征
2022-04-17 18:42:41 200KB 语音识别
1
人工智能_语音识别_视频语音识别_这是一个可以识别视频语音自动生成字幕SRT文件的开源 Windows-GUI 软件工具 VideoSrt 是用 Golang语言,基于 lxn/walk Windows-GUI 工具包开发。 这是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。 适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
2022-04-17 12:05:58 68KB 人工智能 语音识别 音视频 windows
%求增益补偿阈值,凡是小于该阈值的增益系数军用阈值来代替,这样可减少音乐噪声 spec_floor=b*noise_PSD./per_PSD(:,k); spec_floor=spec_floor(:,ones(1,frame_num)); [I,J]=find(g
2022-04-17 09:07:14 16.09MB 语音识别 人工智能 HMM
基于DTW算法的语音识别与实现,介绍了一种语音识别算法
2022-04-16 23:01:00 439KB 语音识别
1
该设计以FPGA为小车运行部分主控,嵌入式系统为小车控制部分主控完成了智能驾驶小车的系统设计,该系统可由非特定人声控制,具有人声控制和实体遥感控制两种驾驶方案,其特色在于采用FPGA而非STM32实现对LD3320的控制,以达到语音识别效果,并完成了实物的制作,同时配备倒车雷达和自动避障功能。实物制作结果表明,该系统较为完整稳定,有较好的实际运用价值。
1
Matlab平台下的使用VQ模型的语音识别代码,绝对可用
2022-04-13 21:05:25 23KB matalab VQ
1
PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签合成则由PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签计算和解码则由Kaldi工具包执行。 该存储库包含PyTorch-Kaldi工具箱的最新版本(PyTorch-Kaldi-v1.0)。 要查看以前的版本(PyTorch-Kaldi-v0.1),请单击此处。 如果您使用此代码或部分代码,请
2022-04-13 17:21:24 362KB Python Deep Learning
1