鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况. 依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3 个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.
2023-02-27 23:52:20 784KB 自然科学 论文
1
语音量化误差的计算,很简单的小测试程序,对于语音量化的同学来说不错
2023-02-27 23:44:49 2KB matlab 语音量化误差
1
Flite: a small run-time speech synthesis engine version 2.1-release Copyright Carnegie Mellon University 1999-2018 All rights reserved http://cmuflite.org https://github.com/festvox/flite Flite是一个开源的小型快速运行文本到语音引擎。 它是免费软件综合工具套件的最新成员,其中包括爱丁堡大学的Festival语音综合系统和卡内基梅隆大学的FestVox项目,用于构建综合声音的工具,脚本和文档。 但是,flite本身不需要这些系统中的任何一个即可进行编译和运行。 核
2023-02-27 22:14:36 19.63MB 系统开源
1
SYN6288 中文语音合成芯片是北京宇音天下科技有限公司于 2010 年初推出的一款性价比更高,效果更自然的一款中高端语音合成芯片。 SYN6288 通过异步串口接收待合成的文本,实现文本到声音( TTS )的转换。
2023-02-27 20:37:14 18KB syn6288 51 语音
1
该APP 用于 android 双向语音测试 opus 编码,支持FEC
2023-02-27 15:46:36 8.41MB webrtc aecm 回声消除 双向语音
1
摘要:系统以单片机和FPGA为控制,实现了语音存储与回放系统。该系统设计方案能够采集模拟语音信号以及耳机立体声信号,以ADPCM(自适应差分编码)的方式提高了存储器的利用率,语音存储时间可达2 min;基于短时傅里叶变换原理,实现了语音信号的频谱分析与实时显示。同时,利用立体声音频功放播放语音,每声道音量可调并具有静噪功能。此外,该方案还采用预加重、去加重、抗混叠滤波等措施,有效地提高了信噪比。语音回放质量良好,存储时间较长。   0 引言   由单片机与FPGA共同完成语音的录制与回放,可以拥有丰富的接口资源和运算能力,鉴于PCM 的存储冗余值过大和DPCM 的量化噪声问题,ADPCM
1
包含了语音信号处理的基本知识 比较精炼 是我们老师上课用的课件
1
(完整版)基于51单片机的医院病房紧急呼叫系统(无线+语音).doc
2023-02-26 18:43:41 663KB (完整版)基于51单片机的医院病
1
中文离线语音包,用于文字转语音模型,采用vosk技术,找vosk调用方法就ok。 最近研究vosk 官网提供的gradle gradle没用过, osk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式。
2023-02-26 16:38:41 41.87MB 文字转语音 vosk
1
语音信号处理 第二章 语音信号处理的基础知识 §2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析 (1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。 (2) 语音中各个音的物理特性和分类的研究称为语音学(phonetics) 。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。 人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。
1