PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签合成则由PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签计算和解码则由Kaldi工具包执行。 该存储库包含PyTorch-Kaldi工具箱的最新版本(PyTorch-Kaldi-v1.0)。 要查看以前的版本(PyTorch-Kaldi-v0.1),请单击此处。 如果您使用此代码或部分代码,请
2022-04-13 17:21:24 362KB Python Deep Learning
1
用于kaldi tools编译
2022-04-06 03:00:43 4.77MB kaldi
1
官方直接下载的CLAPACK是不能编译so动态库文件的,这里集成了Android编译所需的mk文件,可以直接通过ndk编译。
2022-03-30 18:12:19 11.46MB kaldi clapack ml
1
TIMIT TRAIN数据集DR2, 已转换为WAV格式,包括每条语音的标注。
2022-03-12 17:41:41 38.13MB 语音识别 kaldi
1
个人基于Kaldi,开发的安卓端,离线语音识别Module。该模块是从我的安卓项目组件库中抽取出来,可独立测试运行的离线语音识别组件。 感觉实用,请关注博客。将开源更多的个人组件库。
1
docker-kaldi-gstreamer-server kaldi 。 概要 此 dockerfile 自动构建主服务器和工作服务器,这些服务器在来自 Tanel Alumäe 的解释,并由他自己在。 使用此项目,您将能够在几分钟内运行自动语音识别 (ASR) 服务器。 注意力 这里将设置的 ASR 服务器需要一些。 在我将在下面详细介绍的 docker 图像中,不包含 kaldi 模型。 您的机器上必须有这些模型。 您还必须有一个描述这些模型的 yaml 文件。 请、和查看一些示例,以了解如何编写您自己的 yaml 文件。 有一些 kaldi 模型可供下载。 我测试了我的设置与此,这是英语。 我正在尝试为巴西葡萄牙语构建模型,但直到现在我还没有找到足够的免费/开放资源。 安装码头工人 请参考 。 获取图像 从 Docker Hub 拉取镜像(~ 900MB): docke
2021-12-20 21:38:51 461KB docker kaldi asr kaldi-gstreamer-server
1
chime3cnn 用于CNi-DNN评估CHiME-3数据的Kaldi脚本
2021-12-20 21:03:30 4KB Shell
1
安装kaldi必备依赖 openfst-1.6.7.tar.gz sctk-20159b5.tar.gz sph2pipe-2.5.tar.gz cub-1.8.0.tar.gz
2021-12-15 11:36:30 4.71MB kaldi
1
卡尔迪戈普 该项目使用Kaldi计算基于GMM的GOP(发音优度)。 有关基于DNN的实现的说明 此实现是基于GMM的。 对于基于DNN的实现,请检查Kaldi的官方存储库: GOP-DNN的性能应该比GOP-GMM好得多。 如何建造 ./build.sh 运行示例 cd egs/gop-compute ./run.sh 理论 在传统的基于GMM-HMM的系统中,GOP最早是在(Witt等,2000)中提出的。 它被定义为后验的持续时间标准化对数: $$ GOP(p)= \ frac {1} {t_e-t_s + 1} \ log p(p | \ mathbf o)$$ 其中$ \ mathbf o $是输入观测值,$ p $是规范电话,$ t_s,t_e $是开始和结束帧索引。 假设对于任何$ q_i,q_j $,$ p(q_i)\ p(q_j)$,我们有: $$ \ lo
2021-12-06 13:20:45 15KB speech-recognition kaldi C++
1
最全的kaldi学习指导文档,目前是最新版本。 kaldi是一个开源的语音识别工具箱,是基于c++编写的,可以在windows和unix平台上编译。 1)与文本无关的LVCSR系统; 2)基于FST的训练和解码; 3)最大似然训练; 4)各种各样的线性和映射变换; 5)有VTLN,SAT的脚本;
2021-12-02 20:04:34 2.85MB 语音识别 人工智能 kaldi ubuntu
1