Speech dereverberation has been on the agenda of the signal processing community for several years. It is only in the last decade, however, that the topic has really taken off, as seen from the growing number of publications appearing in the journals andat conferences.
2022-02-09 23:35:00 10.72MB Speech Derev
1
第三章节,讲解N-Gram Language Model
2022-02-08 09:13:48 248KB 语言模型 人工智能 自然语言处理 nlp
1
Microsoft Speech SDK包、win7语音修复包、sapi.chm英语、delphi10.3安装过程、demo
2022-01-13 18:03:26 188.01MB Speech speechsdk5.1
1
Kaggle语音识别 这是针对的Kaggle竞赛的项目,目的是为简单的语音命令构建语音检测器。 该模型是使用连接器时间分类(CTC)成本的卷积残差,向后LSTM网络,由TensorFlow编写。 首先将音频波文件转换为滤波器组频谱图。 CNN层从频谱图输入中提取分层特征,而LSTM层的作用类似于编码器/解码器,对CNN特征的序列进行编码,并输出字符作为输出。 LSTM编码器/解码器非常动态。 取决于训练词汇,可以用整个单词,音节或仅音素的信息对发出的字符进行编码。 完全连接的层会压缩表示形式,并进一步将字符与单词解耦。 该项目旨在调试和可视化友好。 提供这些界面以权重和激活,登录TensorBoard并记录示例单词的学习,这些示例单词显示了如何在训练中学习角色和决策边界。 安装和使用: 先决条件:Python 3.5,TensorFlow 1.4; 或Python 3.6,Tens
2022-01-06 13:45:16 1.93MB tensorflow kaggle lstm speech-recognition
1
为微软SAPI(Text-to-Speech API)封装的类 有研究或探讨或开源的请加群:37424970 或联系本人MSN或邮箱:zhuseahui@yahoo.com.cn
2022-01-04 15:14:41 72KB 微软 SAPI 封装
1
用卷积滤波器matlab代码声音和语音 音频,声音和语音相关的论文,工具和文档的存储库 文件 这是无界交织状态递归神经网络(UIS-RNN)算法的库,与论文《完全监督的说话人歧义》相对应。 深度卷积神经网络和数据增强用于声音事件检测 适用于DCASE2017挑战任务的SURREY-CVSSP系统4 按示例进行移动查询的音频指纹计划的调查和评估 工具和代码 这是无界交织状态递归神经网络(UIS-RNN)算法的库,与论文《完全监督的说话人歧义》相对应。 声纹识别 大规模音频分类的CNN架构 SoundNet:从未标记的视频中学习声音表示 音频/声音事件检测: 可视化: :可视工具 一个深度神经网络,用于查找以张量流和张量包编写的与文本无关的说话人嵌入 音乐指纹系统: 用于Chromaprint声学指纹识别和Acoustid Web服务的Echoprint Python绑定的服务器组件AcoustID是一个完全基于开源软件提供完整音频识别服务的项目。 audfprint是一个(经过编译的)Matlab脚本,可以获取一个声音文件列表并创建一个地标数据库,然后随后获取一个或多个查询音频文件并将它
2021-12-31 16:00:13 3KB 系统开源
1
使用uPIT进行语音分离 使用发声级PIT(置换不变训练)进行语音分离 要求 参见 用法 使用生成数据集 准备cmvn,.scp并在.yaml文件中配置实验 训练: ./run_pit.py --config $conf --num-epoches 100 > $checkpoint /train.log 2>&1 & 推理: ./separate.py --dump-dir cache $mdl_dir/train.yaml $mdl_dir/epoch.40.pkl egs.scp 实验 配置 面具 时代 调频 FF 毫米 FF /毫米 AVG AM-ReLU 75 10.41 6.73 7.35 7.19 8.82 sigmod 50 9.95 5.99 6.72 6.35 8.26 PSM-ReLU 73 10.29 6.54 7.28
2021-12-22 17:16:35 23KB pytorch pit speech-separation Python
1
书名:SPEECH ENHANCEMENT Theory and Practice 很好的书!学习语音增强的同学可以看看。
2021-12-21 18:52:49 17.51MB 语音增强
1
这是一个生成功率谱匹配噪声的程序。 这主要是为了让听力学家根据现有的语音语料库(多个语音文件)生成他们自己的语音形状的噪声。 输入可以是任意数量的 wav 文件。 该程序导出所有放在一起的语音文件的傅立叶变换。 然后操纵由此获得的傅立叶变换,使得频谱分量的相位被随机化。 然后使用傅立叶逆变换将得到的修正傅立叶输出转换回时域。 结果是一个语音形状的噪声,其频谱几乎与原始语音语料库的频谱相同。
2021-12-15 18:29:25 2KB matlab
1
基于Microsoft Speech SDK开发的语音合成软件及源码,是你开放语音合成的好源码!
2021-12-14 06:30:18 199KB visaul c++ c++ 语音识别,SAPI,Speech
1