Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启动和停止工作程序 可以进行语音分割,即,基于静音,将长语音信号分为较短的片段 支持任意长的语音输入(例如,您可以将实时语音流式传输到其中) 支持Kaldi的GMM​​和“在线DNN”模型 支持使用大型语言模型对识别格进行记录 支持在请求之间保留声学模型自适应状态 支持无限制的音频编解码器集(实际上
2022-07-27 16:06:16 233.98MB speech-recognition Python
1
freeswitch是开源的VOIP电话交换系统,安装的时候默认只有英文的播报。
2022-07-27 14:04:25 11.61MB freeswitch
1
c# 语音通信
2022-07-26 15:59:53 172KB c# 语音通信
1
基于c#编写的局域网聊天系统,实现功能有基本的聊天与语音聊天,
2022-07-26 15:36:11 475KB 局域网 聊天 语音
1
MATLAB数字语音识别。 实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw 实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw 实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw
1
本练习设计了一个基于语音波形的短时间估计的语音波形自动增益控制系统。 语音信号方差(或等效的短时标准偏差)。 AGC 系统以音节速率(对短时语音信号方差变化的缓慢响应)或瞬时速率(对短时语音信号方差变化的快速响应)运行。
2022-07-26 13:51:32 3.72MB matlab
1
实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw 适合人群:大学生 ,MATLAB变成爱好者,大型设计,数学建模,竞赛,设计,学年大型作业等。 实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw 适合人群:大学生 ,MATLAB变成爱好者,大型设计,数学建模,竞赛,设计,学年大型作业等。
1
实现MATLAB语音数字识别,识别0-9十个阿拉伯数字的音频识别。识别出后可以进行其他拓展操作,比如识别结果1就进行打开某某word文档,识别为2就播放某音乐等等。算法dtw。 适合人群:学生党,算法工程师,大型设计,科研者,爱好者,硕士,博士,本科
1