matlab说话代码语音识别系统 这是关于使用MATLAB实现信号分析和语音识别系统。 特征 Speech_recognition_1.m 音频信号图 语音起点和终点检测 离散傅立叶变换 信号预加重 信号压缩(线性预测编码) Speech_recognition_2.m 特征提取(MFCC) 使用失真矩阵和动态规划的语音识别 数据 该项目中使用的数据是通过人工记录的。 “ 1、2、4、5、6”的声音分别录制了两次,分为2组。 重复录音主要用于语音识别部分,一组已知,用于测试以对语音进行分类。 结果 输出保存在./result目录中。 包括:信号波,DFT波,梅尔倒谱,点检测结果,识别结果。
2022-05-12 08:32:05 1.43MB 系统开源
1
语音识别技术越来越多地用于电话应用,例如旅行预订和信息,金融帐户信息,客户服务呼叫路由和目录服务。 使用受约束的语法识别,此类应用程序可以实现非常高的准确性。 随着实现这种语音激活系统的成本下降并且这些系统的实用性和有效性得到了提高,语音识别技术的研究和开发持续增长。 例如,为电话应用程序优化的识别系统通常可以提供有关特定识别的置信度的信息,如果置信度低,则可以触发该应用程序以提示呼叫者确认或重复他们的请求。 索引词:语音,识别,验证,声音,孤立,单词。
2022-05-04 23:23:10 1.69MB 开源软件
1
口语数字识别 :studio_microphone: LSTM语音数字识别 内容 概述 语音数字识别是一个隔离的单词识别系统,可转录0-9之间的各个语音号码。 数据集 使用免费语音数字数据集(FSDD)来训练该模型,该模型具有来自3位讲英语且带有重音的扬声器的1,500张录音。 该模型接受了1,470张唱片的训练,并在30张唱片上进行了测试。 模型与训练 该模型包括: LSTM层 全连接层 损失函数:分类交叉熵 优化算法:亚当 模型在300个时代进行了训练。 改进和要添加的功能 数据集需要更多不同类型的发言人,包括不同性别和不同口音的人,以便该系统在世界范围内正常运行 模型本身可以改进 使用更好的培训/测试策略 具有使用自己的声音来测试模型的界面,使前端易于与模型进行交互 改善模型性能 基本上,这是我的实验,旨在了解如何构建仅检测语音数字的语音识别系统。 用法 python spoke_digit.py为了运行
1
离线中文语音识别,识别率较高,请大家珍惜的劳动成果谢谢!也是为了赚积分不然不会上传.请大家珍惜劳动成果谢谢
1
深度学习语音识别,基于tensorflow的语音识别程序。程序示例简单实用,便于理解
2022-03-20 21:31:20 22KB python; speech recognition
1
Pocketsphinx Python Pocketsphinx是语音识别开源工具包的一部分。 该软件包为使用和创建的CMU 和库提供了python接口。 支持平台 视窗 Linux Mac OS X 安装 # Make sure we have up-to-date versions of pip, setuptools and wheel python -m pip install --upgrade pip setuptools wheel pip install --upgrade pocketsphinx 提供更多用于手动安装的二进制发行版。 用法 现场语音 这是一个迭代器类,用于从麦克风进行连续识别或关键字搜索。 from pocketsphinx import LiveSpeech for phrase in LiveSpeech (): print ( phr
2022-03-16 20:12:37 34KB python voice speech speech-recognition
1
演讲演示 项目地址: : 文档地址: 语音识别: ://ai.baidu.com/docs#/ASR-API/top 语音合成: ://ai.baidu.com/docs#/TTS-API/top 百度语音rest api调用语音识别,语音合成示例 Rest API接口为http访问,任意操作系统,任意语言,只要能对baidu域名发起http请求的,均可以使用。 百度语音合成的接口支持跨域,但是获取令牌的接口不支持。浏览器直接发请求的示例见: : 简介 以JAVA PHP python C BASH作为示例,展示api的调用过程,选择一个运行即可。 目录结构 +--rest-api
2022-03-09 20:04:55 3.02MB rest-api speech-recognition baidu speech-to-text
1
OpenASR的 基于pytorch的end2end语音识别系统。 主要体系结构是 。 特征 最小依赖。 该系统不依赖外部软件进行特征提取或解码。 用户只需安装PyTorch深度学习框架。 良好的表现。 该系统包括高级算法,例如标签平滑,SpecAug,LST,并在ASHELL1上实现了良好的性能。 AISHELL1测试的基准CER为6.6,优于ESPNet。 模块化设计。 我们将系统分为几个模块,例如培训师,指标,进度表,模型。 扩展和添加功能很容易。 End2End 。 特征提取和标记化是在线的。 系统直接处理波形文件。 因此,该过程大大简化了。 相依性 python> = 3.6 火炬> = 1.1 pyyaml> = 5.1 tensorflow和tensorboardX进行可视化。 (如果不需要可视化结果,可以在src / utils.py中将TENSORBOARD_
2022-03-08 11:24:36 2.24MB speech transformer speech-recognition las
1
语音识别ANN的实现 使用人工神经网络实现语音识别。 使用语言:Python 您需要numpy和scipy才能使其正常工作。 可以识别的词:“ Apple”,“ Banana”,“ Kiwi”,“ Lime”,“ Orange” #如何添加新词 在Audacity或任何音频处理软件中记录您的新单词。 将采样率设置为44100Hz,然后导出到.wav文件。 最好录制许多来自不同扬声器的样本,以提高准确性。 将wav文件放入training_sets目录。 将您的wav文件重命名为您要添加的单词+ -sample_index(例如:hello-1.wav,hello-2.wav)。 这样,特征提取器以后就可以轻松地在文件中进行迭代。 在featureExtractor.py中,将新单词附加到单词数组。 运行featureExtractor.py。 将在mfccData文件夹中生成
2022-02-17 11:07:48 3.63MB Python
1
哥伦比亚大学2016年春季语音识别讲义,覆盖GMM, HMM, 声学模型,语言模型,模型稳健性,深度学习的语音识别等最新知识面
2022-02-15 18:41:42 56.5MB Speech Recognition; 语音识别; ASR
1