VAD基于短时能量的端点检测函数,AudioVAD函数包括两个参数:short*的数据,long的数据长度。返回值为int类型的1或者0,表示该段数据是voice还是silence。 并附上用于测试的pcm数据。
2021-08-23 14:50:49 66.89MB VAD 短时能量 端点检测 音频
1
静音检测
2021-08-20 17:54:57 265KB 静音检测
1
vad:从webrtc抽离出来的vad源代码,供语音分析检测使用
2021-08-20 17:48:31 134KB 系统开源
1
基于卷积神经网络的语音活动检测器 该GitHub存储库是以下论文的代码伴奏: 用于实时语音活动检测的卷积神经网络智能手机应用程序Abhishek Sehgal和Nasser Kehtarnavaz-达拉斯德克萨斯大学 摘要:本文提出了一种智能手机应用程序,该应用程序基于卷积神经网络执行实时语音活动检测。 讨论了实时实现问题,这些问题显示了如何解决与卷积神经网络相关的缓慢推理时间。 开发的智能手机应用旨在充当助听器信号处理管道中降噪的开关,从而能够在嘈杂的语音信号的仅噪声部分进行噪声估计或分类。 将开发的智能手机应用程序与以前开发的语音活动检测应用程序以及两种被引用率很高的语音活动检测算法进行比较。 实验结果表明,使用卷积神经网络开发的应用程序优于以前开发的智能手机应用程序。 资源 可通过以下链接获得与该工作有关的支持材料: 关联 描述 IEEE访问手稿 在Android和iOS智
1
timit语音数据集
2021-07-28 10:09:30 342.65MB 声纹识别 语音识别 VAD ASR
1
py-webrtcrnnvad Webrtc内RNNoise VAD(语音活动检测)组件的Python接口
2021-07-23 16:01:15 2KB
1
ReSpeaker USB 4麦克风阵列 在可用 ReSpeaker USB 4麦克风阵列是ReSpeaker USB 6 + 1麦克风阵列的后继产品。 它具有比6 + 1麦克风阵列更好的内置音频处理算法,因此尽管它只有4个麦克风,但具有更好的音频记录质量。 特征 4个麦克风 12个RGB LED USB 内置AEC,VAD,DOA,波束成形和NS 16000采样率 用法 建议使用测试音频录制。 为Windows安装DFU和LED控制驱动程序 在Linux和macOS上,USB 4麦克风阵列即可使用。 在Windows上,无需安装驱动程序也可以进行音频记录和播放。 但是,为了在Windows上升级设备的固件或控制LED以及DSP参数的LED,需要libusb-win32驱动程序。 我们SEEED DFU为SEEED DFU和SEEED Control安装libusb-win32驱动
2021-06-28 10:25:45 364KB Python
1
android webrtc vad(静音检测) demo webrtc的vad静音检测音频处理模块,含源码。VAD 录音过程中,实时检测当前是否有人在讲话(语音活动检测,或者叫静音检测)。讲话时webRtcVad_Process返回true,不讲话时返回false 直接用android studio打开,编译后“喂喂”两下,看log即可
2021-06-21 16:26:57 45.87MB vad 静音检测 webrtc android
1
合成后的噪声数据集,16k的wav格式,包含了0dB,5dB,15dB的格式,可直接使用,提供了纯净噪声另外自行合成
2021-05-09 21:17:20 34.1MB VAD 语音活动检测 噪声数据集
1