Silero VAD
Silero VAD:经过培训的企业级语音活动检测器(VAD),数字检测器和语言分类器。 企业级语音产品变得非常简单(请参阅我们的模型)。
当前,除WebRTC语音活动检测器()外,几乎没有任何高质量/现代/免费/公共语音活动检测器。 WebRTC虽然开始显示其年龄,但遭受许多误报。
同样在某些情况下,能够使大型口语语料库匿名(即删除个人数据)也至关重要。 如果个人数据包含(i)名称(ii)某些私人ID,则通常被认为是私人/敏感的。 名称识别是一个非常主观的问题,它取决于语言环境和业务案例,但是语音活动和号码检测是非常常规的任务。
主要特点:
现代,便携;
低内存占用;
优于WebRTC的指标;
在庞大的语音语料库和噪音/声音库上受过训练;
比WebRTC慢,但对于IOT /边缘/移动应用程序足够快;
与WebRTC(大多数情况下会从声音中分辨出静
1