PyKaldi是语音识别工具包的Python脚本层。 它为Kaldi和库中的C ++代码提供了易于使用,开销低,一流的Python包装器。 您可以使用PyKaldi编写Python代码来完成其他需要编写C ++代码的事情,例如调用低级Kaldi函数,在代码中操作Kaldi和OpenFst对象或实现新的Kaldi工具。 您可以将Kaldi视为一大盒乐高积木,您可以将它们混合搭配以构建自定义语音识别解决方案。 想到PyKaldi的最好方法是作为补充,如果愿意的话,可以作为Kaldi的助手。 实际上,与Kaldi一起使用时,PyKaldi处于最佳状态。 为此,复制Kaldi提供的无数命令行工具,实用程序脚本和Shell级别配方的功能对于PyKaldi项目而言是非目标。 概述 入门 像Kaldi一样,PyKaldi主要面向语音识别研究人员和专业人员。 人们需要利用Kaldi和OpenFst库提供
2023-02-21 22:06:26 1.2MB python wrapper numpy speech
1
srilm 版本1.7,官网下载比较慢,放到这里来,有需要的可以下载
2023-02-20 19:08:08 62.62MB srilm kaldi
1
进行语音识别的时候会用到timit语音资料库进行训练,但是该资料又很难寻找,于是我将其上传至csdn,希望可以帮助到更多的人。由于csdn上传文件大小限制,我将全部文件拆成三部分,这个是第3部分,其内包含TRAIN文件夹的后半部分,也就是后四个英语方言地区的语音数据。
2023-01-06 17:22:50 136.13MB 人工智能 timit语音资料库 语音识别 kaldi
1
你也可以使用下属命令获取 git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
2022-12-17 12:26:29 142.84MB kaldi kaldi-trunk
1
包括 AISHELL-1_sample数据集 和词典
2022-11-24 20:02:44 98.82MB 语音识别 kaldi aishell1数据集
1
快速的进行语音识别入门开发
2022-10-29 16:00:32 140KB kaldi
1
源码。官网 http://www.netlib.org/clapack/ ,CLAPACK是LAPACK的C语言接口。LAPACK的全称是Linear Algebra PACKage,线性代数库。
2022-09-14 18:32:16 6.87MB openblas lapack kaldi ml
1
Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启动和停止工作程序 可以进行语音分割,即,基于静音,将长语音信号分为较短的片段 支持任意长的语音输入(例如,您可以将实时语音流式传输到其中) 支持Kaldi的GMM​​和“在线DNN”模型 支持使用大型语言模型对识别格进行记录 支持在请求之间保留声学模型自适应状态 支持无限制的音频编解码器集(实际上
2022-07-27 16:06:16 233.98MB speech-recognition Python
1
卡尔迪模型服务器 Kaldi-model-server是用于TDNN链nnet3模型进行在线解码的简单Kaldi模型服务器。 它是用纯Python编写的,并使用将Kaldi作为库进行接口。 它主要用于使用真实麦克风进行实时解码,以及需要在本地进行实时语音识别(例如,听写,语音助手)或多个音频语音流的聚合(例如,解码会议语音)的单用户应用。 当前在与麦克风接口的设备上进行计算。 消息传递服务器和可以将到Web浏览器的事件服务器也可以在不同的设备上运行。 Kaldi-model-server可在Linux(最好是基于Ubuntu / DebianLinux)和Mac OS X上运行。由于redis支持,因此可以轻松地将其与您喜欢的编程语言实时地与解码语音输出进行交互。 出于演示目的,我们添加了一个简单的演示示例应用程序,该应用程序将基于Python的事件服务器与 (event_server
2022-07-17 16:44:24 934KB JavaScript
1
4.8 在线识别 (@冒顿翻译) 在kaldi 的工具集里有好几个程序可以用于在线识别。这些程序都位在 src/onlinebin文件夹里,他们是由src/online文件夹里的文件编译而成(你现在可以 用make ext 命令进行编译).这些程序大多还需要tools文件夹中的portaudio 库文 件支持, portaudio 库文件可以使用tools文件夹中的相应脚本文件下载安装。 这些程序罗列如下: online-gmm-decode-faster: 从麦克风中读取语音,并将识别结果输出到控制台 online-wav-gmm-decode-faster:读取wav文件列表中的语音,并将识别结果以指 定格式输出。 online-server-gmm-decode-faster:从UDP连接数据中获取语音MFCC向量,并将 识别结果打印到控制台。 online-net-client :从麦克风录音,并将它转换成特征向量,并通过UDP连接发 送给online-server-gmm-decode-faster
2022-06-30 11:10:44 2.85MB 语音识别 人工智能 kaldi ubuntu
1