语音合成相关模型,使用地址:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/tree/master/tools/generate_audio 和 https://github.com/yeyupiaoling/PPasr/tree/master/tools/generate_audio
2021-10-25 16:09:17 392.32MB tts asr 语音合成 语音识别
1
myG2P 用于语音识别(ASR)和语音合成(TTS)的缅甸语(缅甸)语言音素到音素(myG2P)转换字典。 မြန်မာလိုဖတ်မယ်ဆိုရင်-> 林森 知识共享署名-非商业性共享相同的4.0国际版(CC BY-NC-SA 4.0)许可证 联系人电子邮件:wasedakuma [at] gmail.com 介绍 我们开发了这个myG2P(缅甸字形到音位)字典的(多语言语音翻译应用程序)缅甸语言项目 ,日本(2014 - 2015年期间)。 我们主要使用MLC(缅甸语言委员会)词典中的单词。 如果使用myG2P词典,请引用和/或。 如果您正在谈论缅甸语的句子级音素到音素转换,请引用《 。 音素到音素的映射 缅甸语言委员会(MLC)语音词典可以用作语音映射的基础。 我们发现有必要用外来语音扩展字典。 在建议的映射表中,有33个辅音的23个语音符号(某些辅音具有相同的发音,例如表1
2021-10-22 18:13:29 6.25MB text-to-speech dictionary myanmar asr
1
PPASR中文语音识别(最终级)模型(thchs30数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-14 12:08:32 614.57MB paddlepaddle 语音识别 asr deepspeech2
1
PPASR中文语音识别(最终级)模型(free_st_chinese_mandarin_corpus数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-14 12:08:23 574.47MB paddlepaddle 语音识别 asr DeepSpeech2
1
PPASR中文语音识别(最终级)模型(aishell数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-13 19:08:50 613.22MB paddlepaddle 语音识别 asr 深度学习
1
语音识别源码(java) ASR Speaker Recognition Enhanced Voice Conference ! Yancheng!Li,!Liang!Wei,!Zhaoyuan!Zhang
2021-09-16 20:21:43 1.29MB 语音识别 ASR
1
标点预测 用于ASR输出的标点符号预测的支持工具。 给出或指出了三种模型; Tensorflow 2中的一个基于BERT的Transformer,一个seq2seq Transformer(均使用PyTorch)和一个双向RNN(Punctuator 2, )。 此外,在文件夹process还提供了用于预处理文本以供这些模型使用的代码。 基于BERT的转换器是来自的令牌分类转换器,在这里用于标点符号预测。 序列转换器的序列来自 ,它基于论文中描述的转换器。注意是您所需要的。 我们为转换器提供的所有内容是:1)数据预处理脚本,以获取用于这些模型的正确格式的数据以进行标点预测的任务,以及2)运行文件,其中对这些模型进行了标点预测的培训。 要求和安装 Python版本> = 3.6 NVIDIA GPU和NCCL 对于HuggingFace基于BERT的令牌分类器和Fairseq序列到序
2021-09-15 10:17:48 79KB Python
1
爱丁堡大学 语音识别(ASR)课程PPT,主要讲述语音识别(Auto Speech Recognition)基础概念及HMM、GMM和DNN。文档为英文版。
2021-09-12 13:40:25 12.54MB 语音识别 ASR HMM DNN
1
The main goal of this lab is to get acquainted with Kaldi. We will begin by creating and exploring a data directory for the TIMIT dataset. Then we will extract features for TIMIT upon which we can train a complete speech recognition system in the coming labs. An underlying goal of this lab is to get you acquainted with Kaldi. Notes on UNIX commands are included in boxes; feel free to skip them if you're already familiar. Most importantly, don't be afraid to ask questions when you get stuck.
2021-09-06 10:42:58 794KB kaldi asr lab 语音识别
1
Pytorch 上的端到端语音识别 基于 Transformer 的语音识别模型 如果您在工作中使用了本工具包中包含的任何源代码,请引用以下论文。 Winata,GI,Madotto,A.,Wu,CS,&Fung,P.(2019年)。 使用来自并行句子的基于神经的合成数据的代码切换语言模型。 在第23届计算自然语言学习会议(CoNLL)的会议记录中(第271-280页)。 Winata, GI, Cahyawijaya, S., Lin, Z., Liu, Z., & Fung, P. (2019)。 使用 Low-Rank Transformer 的轻量级和高效的端到端语音识别。 arXiv 预印本 arXiv:1910.13923。 (被ICASSP 2020接受) Zhou, S., Dong, L., Xu, S., & Xu, B. (2018)。 使用 Transfor
2021-09-05 18:50:50 106KB end-to-end speech pytorch transformer
1