语音语料库_part_17 README TIMIT contains a total of 6300 sentences, 10 sentences spoken by each of 630 speakers from 8 major dialect regions of the United States. Table 1 shows the number of speakers for the 8 dialect regions, broken down by sex. The percentages are given in parentheses. A speaker's dialect region is the geographical area of the U.S. where they lived during their childhood years.
2022-12-08 11:28:38 492KB 音频数据集
1
音频数据扩充 在此存储库中,给出了音频数据增强的示例。 先决条件 NumPy Matplotlib 罗莎 参考
2022-11-17 15:00:12 455KB Python
1
G711A 音频数据 8000采样 精度16bit 单音
2022-09-18 17:41:54 1.88MB G711A 音频数据 8000采样 精度16bit
1
基于ASRT_SpeechRecognition开源项目,对用于训练的数据集进行裁剪,以便用于低性能机器进行训练和学习
2022-06-26 09:08:31 141.95MB 语音识别 音频数据集
1
解码pcm裸音频数据的工具
2022-06-10 16:05:24 33.18MB 解码工具‘
1
麦克蒙 micmon是一个由ML支持的库,用于检测来自文件或音频输入的音频流中的声音。 其开发的用例是创建了一个自建的婴儿监视器,以通过RaspberryPi + USB麦克风检测我的新生儿的哭声,但如果与便携式计算机一起使用,它应该足以检测任何类型的噪音或音频。训练有素的模型。 它通过将音频流分成短段进行工作,为每个段计算FFT和频谱仓,并使用此类频谱数据来训练模型以检测音频。 它适合于声音足够大以至于可以从背景中脱颖而出(例如,可以很好地检测到闹钟的声音,而不是飞蚊子的声音),而声音的大小要比块的大小长得多(非常短)声音将在音频块的频谱中留下很小的痕迹),甚至更好,如果它们的频率带宽与其他声音没有太多重叠(这很容易检测到婴儿的哭声,因为他/她的声音具有音调高于您的音调,但可能无法检测到同一年龄段的两名成年男子的声音在频谱特征上的差异)。 相反,如果您尝试使用它来检测语音,它的性能将不
2022-06-01 08:50:39 187KB JupyterNotebook
1
trainset音频数据集(.fft.npy格式)
2022-05-05 18:06:50 26.96MB 音视频
1
《语音增强理论与时间》书籍的用例代码与测试音频数据,非常经典的语音增强领域的书籍,该资料是作者亲自编码的代码,以及附带了测试音频,非常值得对语音增强感兴趣的读者朋友下载进行研究。如果对相关资料感兴趣,也可以直接联系我本人,可以提供阵列、AGC、AEC降噪等相关开源源码进行探讨。
2022-04-25 20:07:06 105.83MB 音视频 文档资料
以二值图像为水印信息,以音频数据为嵌入对象的音频水印系统,源码+论文稿 本文以二值图像为水印信息,以音频数据为嵌入对象,在分析了数字音频水印的特点和声音信号的理论基础上,从提高水印的不可察觉性和鲁棒性出发,对现有的水印算法进行改进,提出了数字音频水印的算法。首先阐述了本课题的研究背景和意义,并介绍了数字水印问题的提出及相关概念、原理与分类。接着,专门针对音频文件,介绍了数字音频水印算法的基本原理、实现的框架、常见的攻击与对策。结合声音的特性以及人耳的听觉特性,在介绍常见音频文件格式的基础上,区分为时域、变换域、压缩域,从不同的领域分别介绍现有的数字音频水印技术特点,并进行一定的分析与评价。
2022-04-25 18:09:33 5.07MB 音视频 音频数据
概述 : 此示例的功劳归于 Ian Alfred。 他起草了这个例子,我修改了这个例子来解释我的见解和解决方案。 在这个例子中,我们将使用机器学习对城市声音数据集进行分类。 请注意,我不会解释深度学习技术,尽管人们普遍认为深度学习技术可以获得更高的准确性。 让我们先看看我们可以用机器学习做什么。 对于这个项目,我们将使用一个名为 Urbansound8K 的数据集。 该数据集包含来自 10 个类别的城市声音的 8732 个声音摘录(<=4s),它们是: 冷气机汽车喇叭孩子们玩耍狗皮钻Kong发动机怠速枪声手提钻警笛街头音乐 随附的元数据包含每个声音摘录的唯一 ID 及其给定的类名。 此数据集的示例包含在随附的 git 存储库中,完整数据集可从此处下载。 在这个例子中有 7 个里程碑: 里程碑 1:示例介绍、探索和可视化数据里程碑 2:使用诊断应用程序设计器进行数据预处理和提取特征(信号时
2022-04-21 10:24:50 6.73MB matlab
1