VB获取声音波形并进行取样分析,获得输入设备的声音,分析其波形图并显示出来,可以设置不同的取样率、波形图放大比例、曲线颜色滑块等,在多媒体技术中,本程序是比较实用的。
2023-01-06 21:15:41 11KB VB源码-多媒体技术
1
vb环境下利用PC喇叭播放声音的源代码
2023-01-03 09:51:52 3KB 播放声音
1
matlab录入语音信号代码 作者 标题 丹尼尔·莫雷诺·曼萨诺(Daniel Moreno Manzano) 音高估计和发声检测 在本文中,我将解释两种不同方法的发展,以便在语音音频中找到音高,首先区分有声和无声部分。 这些算法将在MATLAB:copyright:中开发。 首先,将对数据进行分析,以便在音频文件数据库中找到要使用的重要参数,并希望了解如何以人的声音音高工作。 在每种方法中,将提出对该思想的简要解释。 此外,还将解释重要的代码部分并公开一些结果。 介绍 两种算法以及分析中处理数据的方式都相同。 音频文件将在32 ms的窗口中进行评估,这是检测仅在浊音部分而不是清音部分的音调的最佳方法。 使用fda_ue数据库(测试数据库)时,窗口将以15 ms的周期移动;使用ptdb_tug数据库( train数据库)时,窗口将以10 ms的周期ptdb_tug 。 我选择的信号处理方法是: 自相关 零交叉+倒谱 要求:在本项目中,将其视为实验是很重要的,以便了解音高处理和估算。 数据 可以通过下一个Google云端硬盘链接获取所使用的数据: 为了在不更改代码的情况下工作,预定义的目录方案是 . ├──
2022-12-25 17:52:13 287KB 系统开源
1
它将包含大约80K个记录,涵盖来自北美、中南美洲和欧洲的1500到2000个物种。这是目前最大的生物声学数据集, 它将包含大约80K个记录,涵盖来自北美、中南美洲和欧洲的1500到2000个物种。这是目前最大的生物声学数据集,
2022-12-22 18:31:13 796.24MB 声音 动物 数据集 深度学习
人的声音数据集,采集了4k的音频样本,从男性声音中采集了2k个样本从女性声音中采集了2k个样本然后我生成了所有这些样本的光谱图。图像的命名惯例是,名称的第一部分显示样本是来自男性声音还是女性声音。标签0用于女性声谱图,1用于男性声谱图。
2022-12-18 18:28:43 261.78MB 声音 数据集 男女
基于Keras+python实现的声纹识别系统完整源码(可训练和测试)+带数据集+训练好的模型+项目说明.7z 【项目】基于深度学习的声纹识别 【主要功能】 通过声音识别人物 实现原理(流程): 音频 → 提取语音特征(FFT、Mel过滤、MFCC)→ CNN&GRU → Triplet loss损失函数训练 + 预训练 + 训练得结果
2022-12-14 16:26:54 838.53MB 声音识别 python源码 keras源码 MFCC
linux下C语言的程序,可以实现ALSA架构的声音采集,并且生成wav格式的音频文件,实现播放的功能。
2022-12-13 11:17:47 30KB linux alsa
1
紧急车辆警报器声音数据集,该数据集由长度为3秒的波形音频文件组成。它们包含紧急车辆-救护车和消防车的警报声。第三个类别叫做Traffic,它包含3秒的.wav格式的纯交通声音音频文件。每个类别包含200个声音文件,每个音频文件的200个声谱图图像,以及用于将每个音频文件转换为声谱图的python脚本。
2022-12-12 11:28:36 281.76MB 数据集 深度学习 紧急车辆 警报器
该数据集包含一个基于康奈尔鸟叫声识别数据集的Mel光谱图训练的ResNet-34模型。它可以用于从音频剪辑中识别鸟类的种类,具有很高的准确性(在未看的剪辑中约55%),涵盖了264个不同的物种声音
2022-12-11 11:27:16 78.08MB 数据集 声音 鸟叫 深度学习
1000个女性声音样本的HND, ENG和GU语言。语音样本的长度为3至8秒。该数据集用于语音性别识别系统。 1000个女性声音样本的HND, ENG和GU语言。语音样本的长度为3至8秒。该数据集用于语音性别识别系统。
2022-12-09 09:30:02 162.6MB 数据集 使声音 女生 样本