Voxseg Voxseg是用于语音活动检测(VAD)的Python软件包,用于语音/非语音音频分段。 它提供了完整的VAD流水线,包括一个预训练的VAD模型,并且基于介绍的工作。 该VAD的使用可引述如下: @inproceedings{cnnbilstm_vad, title = {A hybrid {CNN-BiLSTM} voice activity detector}, author = {Wilkinson, N. and Niesler, T.}, booktitle = {Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)}, year = {2021}, address = {Toronto, Cana
2022-03-02 18:46:08 36.16MB python python-library speech vad
1
webrtc-vad(音频断句/语音端点检测)(单独抽取webrtc中的vad模块,编译成so库移植android平台使用) 代码直接运行即可体验
2021-12-28 20:04:38 3.9MB android webrtc 语音端点检测 vad
基于相关检测算法的语音活动检测( VAD),程序采用 matlab编程。
2021-12-19 13:05:35 476B VAD 相关检测算法 matlab
1
webrtc中的vad检测。 是从webrtc中把vad检测的代码给提取出来的,在vs2010下编译生成的,其中signal_process编成了静态库,在文件里面也包含。 webrtc vad检测
2021-11-18 14:40:34 1.14MB webrtc vad vs2010 signal_proce
1
本程序是一个基于MFCC和VAD端点检测的简易语音门锁课程设计的程序,检测时需要事先录入提供多个样本当作语音库,然后程序会通过你测试时的语音阈值与库里语音匹配,然后进行检测。由于算法较为简单,也没进行多重训练,识别率较低。
2021-10-29 16:35:08 6.25MB matlab MFCC VAD
1
使用VAD技术清理wav文件中的静音片段介绍folder construction获取所有“说话人”名称创建目的文件夹(与说话人名称保持一直)**划重点**VAD处理部分分步执行导入库导入一个语音文件for循环 其中is_speech用来判断是否为静音部分~展示一下有用信息,并绘图拼接黄线部分,并且打印在cell中事先听一下~整体执行(批量处理)总结 介绍 VAD技术,全称为Voice Activity Detection。是去除噪音非常有效的技术。在本文中我将以一段比较笨拙的代码,讲述我是如何通过Python来实现批量处理wav文件中的静音,并且生成到新的文件夹内的。 优点:可以减少多余的语
2021-10-27 14:36:31 168KB python w
1
不支持HTML标签。 详细的资源描述有机会获得我们的推荐,更有利于他人下载
2021-10-11 12:26:36 3KB vad matlab
1
pyvad VAD(Voice Activity Detector) python 实现对读入的流式数据, 进行端点检测 依赖 pyaudio 测试平台 Distributor ID: Ubuntu Description: Ubuntu 12.04.5 LTS Release: 12.04 Codename: precise Linux ubuntu 3.13.0-32-generic #57~precise1-Ubuntu SMP Tue Jul 15 03:51:20 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux Python 2.7.3 联系方式
2021-09-16 14:05:36 545KB Python
1
是从webrtc中把vad检测的代码给提取出来的,在vs2010下编译生成的,其中signal_process编成了静态库,在文件里面也包含。
2021-08-26 10:22:26 1.04MB webrtc vad检测
1
基于c语言的语音活动检测算法,用于VAD开发借鉴和使用
2021-08-26 10:18:41 19KB VAD
1