上传者: 42109732
|
上传时间: 2021-12-07 13:45:37
|
文件大小: 1.07GB
|
文件类型: -
混合语言语音识别
来自团队:
当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。
-
表中的内容:
目录说明
代码开关:
包含用于构建系统的脚本
描述:
LDC2015S04,我们的数据集描述
笔记:
我们关于Kaldi相关timit研究笔记,包括timit和librispeech
建立系统的资源
数据源:
基准模型文件:
其他与代码转换有关的论文:
功能改进相关论文:
有趣的Python Kaldi包装器将被检查:
卡尔迪推荐的食谱要检查:
卡尔迪资源:
卡尔迪(Kaldi)范例
解码
数据准备:
文档名称:
图案