The main goal of this lab is to get acquainted with Kaldi. We will begin by creating and exploring a data directory for the TIMIT dataset. Then we will extract features for TIMIT upon which we can train a complete speech recognition system in the coming labs. An underlying goal of this lab is to get you acquainted with Kaldi. Notes on UNIX commands are included in boxes; feel free to skip them if you're already familiar. Most importantly, don't be afraid to ask questions when you get stuck.
2021-09-06 10:42:58 794KB kaldi asr lab 语音识别
1
Pytorch 上的端到端语音识别 基于 Transformer 的语音识别模型 如果您在工作中使用了本工具包中包含的任何源代码,请引用以下论文。 Winata,GI,Madotto,A.,Wu,CS,&Fung,P.(2019年)。 使用来自并行句子的基于神经的合成数据的代码切换语言模型。 在第23届计算自然语言学习会议(CoNLL)的会议记录中(第271-280页)。 Winata, GI, Cahyawijaya, S., Lin, Z., Liu, Z., & Fung, P. (2019)。 使用 Low-Rank Transformer 的轻量级和高效的端到端语音识别。 arXiv 预印本 arXiv:1910.13923。 (被ICASSP 2020接受) Zhou, S., Dong, L., Xu, S., & Xu, B. (2018)。 使用 Transfor
2021-09-05 18:50:50 106KB end-to-end speech pytorch transformer
1
轮毂电机电动汽车ASR仿真研究.pdf
BembaASR模型 该存储库包含用于在“ 重现实验的资源(数据集,代码和脚本)。 实验装置 在该项目中,我们使用版本进行了实验。 我们向读者推荐以获得最新更新。 资源资源 数据集 该项目中使用的数据来自语料库。 根据DeepSpeech输入管道要求,它包含大小不超过10秒的音频文件。 ID 数据集 关联的CSV文件 定义 1个 用于训练 2 用于验证 3 用于测试 语言模型 本实验中使用的5克LM是使用DeepSpeech v0.8.2的默认参数值创建的 声学模型
2021-08-25 23:02:08 1.91MB JupyterNotebook
1
端到端ASR的LF-MMI的PyTorch实现 在PyTorch中实现的无网格MMI的端到端版本(LF-MMI或链模型)。 TODO :LF-MMI的常规版本。 什么是新的: 2020年8月:对数域中图形的GPU计算(建议用于分子图形) 2020年4月:在小批量生产中支持长度不等的序列 2020年4月:使用: 和 2020年1月:分母和分子图的GPU计算 安装及要求 版本> = 1.4.0 首次安装(包括 ) pip install kaldi_io git clone https://github.com/YiwenShaoStephen/pychain.git cd pychain make 更新 每当您更新或修改pychain中的任何非Python代码(例如.c或.cu)时,都需要通过以下方式重新编译它: make pychain 参考 “ PyChain:用于端到端A
2021-08-24 17:36:40 33KB C++
1
里面都是干货啊,这种比较好的文档肯定是英文的,好东西还要多看几遍才能掌握i
2021-08-23 19:42:32 29.46MB 语音, 机器学习
1
用于隔离数字识别的简单GMM-HMM模型 简单的GMM和HMM模型的Python实现,用于隔离数字识别。 此实现包含3个模型: 单一高斯:使用具有对角协方差的单一高斯对每个数字进行建模。 高斯混合模型(GMM):每个数字都是使用高斯混合模型来建模的,并通过扰动单个高斯模型进行初始化。 隐马尔可夫模型(HMM):每个数字由包含N个状态的HMM建模,其中每个状态的发射概率是具有对角协方差的单个高斯分布。 免责声明:这是一个教育性的实现,预计不会有很高的性能。 安装 要安装使用: pip install git+https://github.com/desh2608/gmm-hmm-asr.git 要安装测试(用于开发): git clone https://github.com/desh2608/gmm-hmm-asr.git cd gmm-hmm-asr && pip ins
2021-08-20 16:40:11 77.68MB Python
1
PPASR中文语音识别(进阶级)模型(thchs30数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR/tree/%E8%BF%9B%E9%98%B6%E7%BA%A7
2021-08-16 09:14:25 607.29MB 深度学习 语音识别 paddlepaddle asr
1
解析深度学习-语音识别实践-英文版,没有找到中文版的
2021-08-08 07:12:07 7.53MB asr
1
包含ASR芯片的所有开发文档,有协议指令描述,硬件描述,使用描述,环境配置描述
2021-08-07 16:39:12 11.96MB ASR芯片
1