语音活动检测项目 关键字:Python,TensorFlow,深度学习,时间序列分类 目录 1.11.21.3 2.12.2 5.15.2将5.35.4 去做 资源 1.安装 该项目旨在: Ubuntu的20.04 的Python 3.7.3 TensorFlow 1.15.4 $ cd /path/to/project/ $ git clone https://github.com/filippogiruzzi/voice_activity_detection.git $ cd voice_activity_detection/ 1.1基本安装 $ pip3 install -r requirements.txt $ pip3 install -e . 1.2虚拟环境安装 1.3 Docker安装 构建docker镜像: $ sudo make build (这可能
1
VAD-python, 在 python 中,语音活动检测语音活动检测器用于波形文件的python 码的应用。 语音能量与总能量比值的语音活动检测器。要求numpyscipymatplotlib基本思想输入的音频数据如下:将立体声转换为单声道沿音频数据移动 20ms 个窗口
2022-06-30 09:12:20 23KB 开源
1
Voxseg Voxseg是用于语音活动检测(VAD)的Python软件包,用于语音/非语音音频分段。 它提供了完整的VAD流水线,包括一个预训练的VAD模型,并且基于介绍的工作。 该VAD的使用可引述如下: @inproceedings{cnnbilstm_vad, title = {A hybrid {CNN-BiLSTM} voice activity detector}, author = {Wilkinson, N. and Niesler, T.}, booktitle = {Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)}, year = {2021}, address = {Toronto, Cana
2022-03-02 18:46:08 36.16MB python python-library speech vad
1
功能:实现语音活动检测 算法实现:可参见文献 输入参数说明:语音信号 返回参数说明:语音是否活动的标志,信噪比
2021-12-13 15:46:14 2KB matlab snr 信噪比 音频
1
基于c语言的语音活动检测算法,用于VAD开发借鉴和使用
2021-08-26 10:18:41 19KB VAD
1
基于卷积神经网络的语音活动检测器 该GitHub存储库是以下论文的代码伴奏: 用于实时语音活动检测的卷积神经网络智能手机应用程序Abhishek Sehgal和Nasser Kehtarnavaz-达拉斯德克萨斯大学 摘要:本文提出了一种智能手机应用程序,该应用程序基于卷积神经网络执行实时语音活动检测。 讨论了实时实现问题,这些问题显示了如何解决与卷积神经网络相关的缓慢推理时间。 开发的智能手机应用旨在充当助听器信号处理管道中降噪的开关,从而能够在嘈杂的语音信号的仅噪声部分进行噪声估计或分类。 将开发的智能手机应用程序与以前开发的语音活动检测应用程序以及两种被引用率很高的语音活动检测算法进行比较。 实验结果表明,使用卷积神经网络开发的应用程序优于以前开发的智能手机应用程序。 资源 可通过以下链接获得与该工作有关的支持材料: 关联 描述 IEEE访问手稿 在Android和iOS智
1
py-webrtcrnnvad Webrtc内RNNoise VAD(语音活动检测)组件的Python接口
2021-07-23 16:01:15 2KB
1
合成后的噪声数据集,16k的wav格式,包含了0dB,5dB,15dB的格式,可直接使用,提供了纯净噪声另外自行合成
2021-05-09 21:17:20 34.1MB VAD 语音活动检测 噪声数据集
1
来源于webrtc的vad音频处理模块,含源码。VAD - 录音过程中,实时检测当前是否有人在讲话(语音活动检测,或者叫静音检测)。讲话时webRtcVad_Process返回true,不讲话时返回false。直接用android studio打开,编译后“喂喂”两下,看log即可。by tanyaping,欢迎技术交流。
2019-12-21 21:09:47 41.85MB vad webrtc 静音检测
1