免费口语数据集(FSDD) 一个简单的音频/语音数据集,由8kHz的wav文件中的口头录音组成。 修整录音,使其在开始和结束时几乎保持静音。 FSDD是一个开放的数据集,这意味着它将随着时间的推移随着数据的添加而增长。 为了实现可重复性和准确的引用,使用Zenodo DOI和git tags对数据集进行版本控制。 当前状态 6位演讲者 3,000个录音(每个扬声器每个数字50个) 英语发音 组织 文件以以下格式命名: {digitLabel}_{speakerName}_{index}.wav示例: 7_jackson_32.wav 会费 请贡献您的自制录音。 所有录音应为单声道8kHz wav文件,并进行修剪以使静音降至最低。 不要忘记使用发言人元数据更新metadata.py 要添加数据,请按照acquire_data/say_numbers_prompt.py的记录说明进行a
2021-10-07 19:23:06 15.66MB audio machine-learning dataset mnist
1
该演示为音频数据的基本过滤提供了一个简单的 GUI。 使用 GUI,您可以: * 加载存储在 .wav 文件中的音频数据。 * 使用低通、高通或带通数字滤波器在特定音频频率中生成均匀噪声。 * 将过滤后的噪声添加到原始音频信号中。 * 通过逆滤波去除噪声。 此演示的目的不是提供强大而复杂的去噪算法,而只是演示 Matlab 中的一些基本音频过滤过程。 ------------------------------------ http://www.di.uoa.gr/~tyiannak ------------------------------------
2021-10-07 10:24:03 317KB matlab
1
行业-电子政务-音频数据处理方法及电子设备.zip
行业-电子政务-音频数据传输系统、音频数据传输装置及电子签名工具.zip
行业-电子政务-音箱、音频数据的播放方法、装置、存储介质及电子装置.zip
音频数据处理常用算法:FFT、功率谱计算。
2021-08-11 10:21:25 19KB FFT 功率谱分析
1
前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一起期待吧!! 这个案例的视频地址在这里 https://v.douyu.com/show/a2JEMJj3e3mMNxml 项目目标 爬取喜马拉雅音频数据 受害者地址 https://www.ximalaya.com/ 本文知识点: 1、系统分析网页性质 2、多层数据解析 3、海量音频数据保存 环境: 1.确定数据所在的链接地址(url) 2.通过代码发送url地址的请求 3.解析数据(要的,
2021-08-09 15:11:04 265KB Python爬虫实战 喜马拉雅 实战
1
深度学习不仅扩展到图像,还扩展到一维信号,例如音频。 它可以灵活地处理传统信号分析难以解决的各种环境中的复杂问题。 在此文件中,您可以在几分钟内以“Hammering Test”为例,尝试对音频数据进行简单的深度学习。 本演示介绍了从“音频数据的获取”到“网络设计和学习”的工作流程。 #Demo Video(日语) 演示。 https://jp.mathworks.com/videos/deep-learning-for-hammering-test-1576046662504.html [8:24~] : 这个脚本的结果
2021-07-21 19:23:27 13KB matlab
1
A Python library for audio data augmentation. Inspired by albumentations. Useful for machine learning.
2021-07-18 14:07:03 289KB Python开发-机器学习
1
DSP语音加密,通过音频数据的镜像翻转对音频进行加密,从mic接口输入,从line out接口输出,用按键控制,key_1录音,Key_2播放加密音频, Key_3播放解密音频
2021-07-17 09:02:19 252KB dsp 语音加密
1