关于
Vosk是一个离线开源语音识别工具包。 它支持17种语言和方言的语音识别模型-英语,印度英语,德语,法语,西班牙语,葡萄牙语,中文,俄语,土耳其语,越南语,意大利语,荷兰语,加泰罗尼亚语,阿拉伯语,希腊语,波斯语,菲律宾语。
Vosk模型很小(50 Mb),但提供连续的大词汇量转录,具有流API的零延迟响应,可重新配置的词汇量和说话者识别。
为各种编程语言(如Python,Java,Node.JS,C#,C ++等)实现的语音识别绑定。
Vosk为聊天机器人,智能家电,虚拟助手提供语音识别。 它还可以为电影创建字幕,为演讲和访谈创建转录字幕。
Vosk从Raspberry Pi或Android智能手机等小型设备扩展到大型集群。
文献资料
有关安装说明,示例和文档,请访问。
1