搜索【Kaldi】的结果

pytorch-kaldi是一个用于开发最新的DNN / RNN混合语音识别系统的项目。 DNN部分由pytorch管理，而特征提取，标签计算和解码则通过kaldi工具箱执行。-Python开发

PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库，用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理，而特征提取，标签合成则由PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库，用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理，而特征提取，标签计算和解码则由Kaldi工具包执行。该存储库包含PyTorch-Kaldi工具箱的最新版本（PyTorch-Kaldi-v1.0）。要查看以前的版本（PyTorch-Kaldi-v0.1），请单击此处。如果您使用此代码或部分代码，请

2022-04-13 17:21:24 362KB Python Deep Learning

1

kaldi tools编译容易缺的几个包

用于kaldi tools编译

2022-04-06 03:00:43 4.77MB kaldi

1

用于Android平台进行kaldi编译的CLAPACK-3.2.1.zip

官方直接下载的CLAPACK是不能编译so动态库文件的，这里集成了Android编译所需的mk文件，可以直接通过ndk编译。

2022-03-30 18:12:19 11.46MB kaldi clapack ml

1

TIMIT TRAIN数据集已转换为WAV格式

TIMIT TRAIN数据集DR2，已转换为WAV格式，包括每条语音的标注。

2022-03-12 17:41:41 38.13MB 语音识别 kaldi

1

lib-share-asr.zip

个人基于Kaldi，开发的安卓端，离线语音识别Module。该模块是从我的安卓项目组件库中抽取出来，可独立测试运行的离线语音识别组件。感觉实用，请关注博客。将开源更多的个人组件库。

2022-02-19 18:45:22 88.7MB Android离线语音识别 离线语音识别 Kaldi Kaldi-Android

1

docker-kaldi-gstreamer-server:kaldi-gstreamer-server 的 Dockerfile-源码

docker-kaldi-gstreamer-server kaldi 。概要此 dockerfile 自动构建主服务器和工作服务器，这些服务器在来自 Tanel Alumäe 的解释，并由他自己在。使用此项目，您将能够在几分钟内运行自动语音识别 (ASR) 服务器。注意力这里将设置的 ASR 服务器需要一些。在我将在下面详细介绍的 docker 图像中，不包含 kaldi 模型。您的机器上必须有这些模型。您还必须有一个描述这些模型的 yaml 文件。请、和查看一些示例，以了解如何编写您自己的 yaml 文件。有一些 kaldi 模型可供下载。我测试了我的设置与此，这是英语。我正在尝试为巴西葡萄牙语构建模型，但直到现在我还没有找到足够的免费/开放资源。安装码头工人请参考。获取图像从 Docker Hub 拉取镜像（~ 900MB）： docke

2021-12-20 21:38:51 461KB docker kaldi asr kaldi-gstreamer-server

1

chime3cnn:用于CNi-DNN评估CHiME-3数据的Kaldi脚本-源码

chime3cnn 用于CNi-DNN评估CHiME-3数据的Kaldi脚本

2021-12-20 21:03:30 4KB Shell

1

必备四公子.zip

安装kaldi必备依赖 openfst-1.6.7.tar.gz sctk-20159b5.tar.gz sph2pipe-2.5.tar.gz cub-1.8.0.tar.gz

2021-12-15 11:36:30 4.71MB kaldi

1

kaldi-gop:计算基于GMM的发音善度（GOP）。基于卡尔迪-源码

卡尔迪戈普该项目使用Kaldi计算基于GMM的GOP（发音优度）。有关基于DNN的实现的说明此实现是基于GMM的。对于基于DNN的实现，请检查Kaldi的官方存储库： GOP-DNN的性能应该比GOP-GMM好得多。如何建造 ./build.sh 运行示例 cd egs/gop-compute ./run.sh 理论在传统的基于GMM-HMM的系统中，GOP最早是在（Witt等，2000）中提出的。它被定义为后验的持续时间标准化对数： $$ GOP（p）= \ frac {1} {t_e-t_s + 1} \ log p（p | \ mathbf o）$$ 其中$ \ mathbf o $是输入观测值，$ p $是规范电话，$ t_s，t_e $是开始和结束帧索引。假设对于任何$ q_i，q_j $，$ p（q_i）\ p（q_j）$，我们有： $$ \ lo

2021-12-06 13:20:45 15KB speech-recognition kaldi C++

1

kaldi的全部资料_v0.7(未完成版本).pdf

最全的kaldi学习指导文档，目前是最新版本。 kaldi是一个开源的语音识别工具箱，是基于c++编写的，可以在windows和unix平台上编译。 1)与文本无关的LVCSR系统； 2)基于FST的训练和解码； 3)最大似然训练； 4)各种各样的线性和映射变换； 5)有VTLN，SAT的脚本；

2021-12-02 20:04:34 2.85MB 语音识别 人工智能 kaldi ubuntu

1

个人信息

热门下载

最新下载

其他资源