Microsoft可伸缩的嘈杂语音数据集(MS-SNSD)
此数据集包含大量以16 kHz采样的.wav格式的干净语音文件和各种环境噪声文件。
该数据集的主要应用是训练深度神经网络(DNN)模型以抑制背景噪声。 但是它可以用于其他音频和语音应用程序。
我们提供了在各种信噪比(SNR)条件下混合干净语音和噪声以生成大型嘈杂语音数据集的方法。
可以根据应用要求配置SNR条件和所需的数据小时数。
随着我们鼓励研究人员和从业人员通过添加更多清晰的语音和噪声片段为该数据集做出贡献,该数据集的大小将继续增长。
该数据集将极大地帮助学院和行业的研究人员和从业人员开发更好的模型。
我们还提供与训练集不同的测试集,以评估开发的模型。
我们提供html代码,用于构建两个Human Intelligence Task(HIT)众包应用程序,以允许用户对嘈杂的音频片段进行评分。 我们根据ITU-T
2022-05-16 15:05:30
2GB
HTML
1