应用背景语音识别是当今生活中的一个热门话题。语音识别的应用可以随处可见,这使我们的生活更为有效。例如在手机上的应用,而不是打电话的人的名字,人们可以直接说出姓名的人到手机,和手机会自动呼叫那个人。如果人们想给别人发短信,人们也可以把短信发到手机上,而不是打字。语音识别是一种人们可以用自己的语言来控制系统的技术。代替键盘或操作系统的按钮,使用语音来控制系统更方便。同时也可以降低工业生产的成本。使用语音识别系统不仅提高了日常生活的效率,而且使人们的生活更加多样化关键技术总的来说,这个项目的目的是探讨通过编程与仿真设计的系统是基于matlab的语音识别算法。同时,该项目的另一个目的是利用所学到的知识的实际应用。在这个项目中,我们将计划2个系统。这两个设计系统的主要算法是相关和Mel频率倒谱系数。为了得到可靠的结果,测试将在不同的情况下完成。首先,测试环境将噪声和无噪声分别为研究设计系统的噪声免疫力。测试的话,将选择不同的对,是容易3 | P A G E公认的单词和难识别的单词。由于设计的系统需要三个输入语音的话,这是2个参考语音和一个目标语音的话,所以这是显着的检查,如果两者的设计系统工作时
2022-07-13 11:07:25 678KB MFCC 说话人识别系统
基于MELFCC和随机森林的说话人识别系统
2022-05-30 14:07:40 991KB 随机森林 源码软件 算法 机器学习
在MATLAB环境下实现基于矢量量化的说话人识别系统。在实时录音的情况下,利用该说话人识别系统,对不同的人的1s~7s的语音进行辨识。实现与文本无关的自动说话人确认的实时识别。 使用说明: 1 训练打开Matlab 使Current Directory为VQ所在的文件夹(比如:E:\vq) 在Command windows中输入
2022-04-16 15:56:16 691KB MATLAB VQ 说话人识别系统
1
这是一个说话人识别系统,特征是LPC倒谱系数,文件包含11个训练和测试语音素材,采样率为12.5kHz,用11个素材测试识别率可以达到100%,但是通过录音进行测试,有时候会出现错误。
2022-04-08 20:23:14 599KB 说话人识别 LPC倒谱 短时谱
1
基于MATLAB完成的说话人识别的完整代码,注释详细,程序可运行,内附readme文件,详细解释了如何运行。
2022-01-01 20:55:05 1.59MB VQ 说话人识别 matlab
1
这是 Python3 的 VoiceID 端口。 原始版本在这里: : 。 VoiceID 是一个用 Python 编写的说话人识别/识别系统,基于 LIUM Speaker Diarization 框架。 VoiceID 可以对视频或音频文件进行处理,以识别在哪个时间片有人说话(diarization); 然后它检查所有这些段以确定谁在说话。 为此使用语音模型数据库。
2021-11-27 19:42:37 4.94MB Python
1
关于 这是带有GUI的系统。 有关此项目的更多详细信息,请参见: 我们的 我们的 依存关系 可用于更轻松地开始该项目。 Linux,Python 2 , , , : pip install --user scikit-learn scikits.talkbox pyssp PyAudio ,通常可以由您的软件包管理器安装。 (可选) Python绑定: 安装闪电战,openblas,boost,然后: for p in bob.extension bob.blitz bob.core bob.sp bob.ap; do pip install --user $p done 注意:我们自己有一个MFCC实现,当bob不可用时,该实现将用作备用。 但是它不如bob中的C实现高效。 使用的算法 语音活动检测(VAD): (LTSD) 特点: (MFCC) (L
2021-10-10 17:47:55 25.69MB 系统开源
1
Voxceleb1数据集中的说话人验证任务 该存储库包含使用Kaldi在Voxceleb1 [1]数据集上训练i-vector说话者识别系统的简单脚本。 它是根据Kaldi / egs / sre10上的run.sh文件修改的。 要求 卡尔迪工具包 如何使用 将所有文件移至{kaldi_root} / egs / sre10文件夹 修改run.sh文件中的数据集目录和参数以适合您的计算机。 运行run.sh文件 结果 使用voxceleb1训练数据对2048个组件GMM-UBM和600维i-vector提取器进行了训练,以进行验证任务。 与Kaldi egs上的sre10基线相比,训练参数几乎相同。 GMM-2048 CDS有效值:15.39% GMM-2048 LDA + CDS eer:8.103% GMM-2048 PLDA eer:5.446% 笔记 Voxceleb1数据集是
1
生物识别技术是一个新兴的技术领域,它使用独特且可测量的物理、生物或行为特征,可以对其进行处理以识别一个人。 人类的生物特征是指纹、虹膜、面部和声音。 生物识别技术的简明定义是“使用不同特征自动识别人”。 语音是生物特征之一,它是作为声音序列产生的。 声带的振动,以及各种咬合器(如舌头、嘴唇和牙齿)的位置、形状和大小都会产生所产生的声音。声音的特征因人而异,可以用于识别个人。 虽然通常认为不如其他类型的生物识别系统准确,但语音识别系统可以与其他生物识别系统结合使用,以创建更强大的识别系统说话人识别主要涉及特征提取和特征匹配两个模块。 特征提取是从说话者的语音信号中提取少量数据的过程,这些数据稍后可以用来代表该说话者。 特征匹配涉及通过将从他/她的语音输入中提取的特征与已经存储在我们的语音数据库中的特征进行比较来识别未知说话者的实际过程。 在特征提取中,我们找到梅尔频率倒谱系数 (MFCC),
2021-07-05 15:39:23 1.18MB matlab
1