前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章。基于这个知识基础之上,我们训练一个声纹识别模型,通过这个模型我们可以识别说话的人是谁,可以应用在一些需要音频验证的项目。 环境准备 主要介绍libsora,PyAudio,pydub的安装,其他的依赖包根据需要自行安装。 Python 3.7 Tensorflow 2.0 安装libsora 最简单的方式就是使用pip命令安装,如下: pip install pytest-runner pip install librosa 如果pip命令安装不成功,那就使用源码安装,下载源码:, windows的可以下载zip压缩包,方便解压。 pip install pytest-runner tar xzf librosa-<版本号>.tar.gz 或者 unzip librosa-
2021-10-16 12:30:32 17KB tensorflow voice-recognition Python
1
GMM_Digital_Voice_Recognition 基于GMM与MFCC特征进行数字0-9的语音识别,GMM,MFCC,语音识别,中文数据,sklearn,scikit-learn,数字语音识别。 预安装 conda create -n GMM -c anaconda python=3.6 numpy pyaudio scipy #也可以使用pip conda activate GMM pip install -r requirements.txt 数据链接: ://pan.baidu.com/s/124TiAs8m7Ioa2_3dUrxGSg提取码:xsfe 以下命令假设下载
1