搜索【音频数据】的结果

TIMIT 语音语料库-part-16 Acoustic-Phonetic Continuous Speech Corpus

语音语料库_part_16 TEST DR8 TIMIT contains a total of 6300 sentences, 10 sentences spoken by each of 630 speakers from 8 major dialect regions of the United States. Table 1 shows the number of speakers for the 8 dialect regions, broken down by sex. The percentages are given in parentheses. A speaker's dialect region is the geographical area of the U.S. where they lived during their childhood years.

2022-12-08 11:28:38 11.21MB 音频数据集

1

TIMIT 语音语料库-part-17 Acoustic-Phonetic Continuous Speech Corpus

语音语料库_part_17 README TIMIT contains a total of 6300 sentences, 10 sentences spoken by each of 630 speakers from 8 major dialect regions of the United States. Table 1 shows the number of speakers for the 8 dialect regions, broken down by sex. The percentages are given in parentheses. A speaker's dialect region is the geographical area of the U.S. where they lived during their childhood years.

2022-12-08 11:28:38 492KB 音频数据集

1

audio-data-augmentation:音频数据扩充示例

音频数据扩充在此存储库中，给出了音频数据增强的示例。先决条件 NumPy Matplotlib 罗莎参考

2022-11-17 15:00:12 455KB Python

1

G711A 音频数据 8000采样精度16bit 单音

2022-09-18 17:41:54 1.88MB G711A 音频数据 8000采样 精度16bit

1

裁剪后的语音识别thchs30数据集

基于ASRT_SpeechRecognition开源项目，对用于训练的数据集进行裁剪，以便用于低性能机器进行训练和学习

2022-06-26 09:08:31 141.95MB 语音识别 音频数据集

1

Audacity工具，可以解码pcm裸音频数据

解码pcm裸音频数据的工具

2022-06-10 16:05:24 33.18MB 解码工具‘

1

micmon:一个Python库和一组脚本，用于从原始音频文件创建带标签的音频数据集，并使用它们来训练声音检测模型

麦克蒙 micmon是一个由ML支持的库，用于检测来自文件或音频输入的音频流中的声音。其开发的用例是创建了一个自建的婴儿监视器，以通过RaspberryPi + USB麦克风检测我的新生儿的哭声，但如果与便携式计算机一起使用，它应该足以检测任何类型的噪音或音频。训练有素的模型。它通过将音频流分成短段进行工作，为每个段计算FFT和频谱仓，并使用此类频谱数据来训练模型以检测音频。它适合于声音足够大以至于可以从背景中脱颖而出（例如，可以很好地检测到闹钟的声音，而不是飞蚊子的声音），而声音的大小要比块的大小长得多（非常短）声音将在音频块的频谱中留下很小的痕迹），甚至更好，如果它们的频率带宽与其他声音没有太多重叠（这很容易检测到婴儿的哭声，因为他/她的声音具有音调高于您的音调，但可能无法检测到同一年龄段的两名成年男子的声音在频谱特征上的差异）。相反，如果您尝试使用它来检测语音，它的性能将不

2022-06-01 08:50:39 187KB JupyterNotebook

1

trainset音频数据集(.fft.npy格式)

2022-05-05 18:06:50 26.96MB 音视频

1

《语音增强理论与时间》书籍的用例代码与测试音频数据

《语音增强理论与时间》书籍的用例代码与测试音频数据，非常经典的语音增强领域的书籍，该资料是作者亲自编码的代码，以及附带了测试音频，非常值得对语音增强感兴趣的读者朋友下载进行研究。如果对相关资料感兴趣，也可以直接联系我本人，可以提供阵列、AGC、AEC降噪等相关开源源码进行探讨。

2022-04-25 20:07:06 105.83MB 音视频 文档资料

以二值图像为水印信息，以音频数据为嵌入对象的音频水印系统，源码+论文稿

以二值图像为水印信息，以音频数据为嵌入对象的音频水印系统，源码+论文稿本文以二值图像为水印信息，以音频数据为嵌入对象，在分析了数字音频水印的特点和声音信号的理论基础上，从提高水印的不可察觉性和鲁棒性出发，对现有的水印算法进行改进，提出了数字音频水印的算法。首先阐述了本课题的研究背景和意义，并介绍了数字水印问题的提出及相关概念、原理与分类。接着，专门针对音频文件，介绍了数字音频水印算法的基本原理、实现的框架、常见的攻击与对策。结合声音的特性以及人耳的听觉特性，在介绍常见音频文件格式的基础上，区分为时域、变换域、压缩域，从不同的领域分别介绍现有的数字音频水印技术特点，并进行一定的分析与评价。

2022-04-25 18:09:33 5.07MB 音视频 音频数据

个人信息

热门下载

最新下载

其他资源