回顾歌唱语音检测:定量回顾和未来展望 此回购包含了在2018年第19届国际音乐信息检索会议(ISMIR)上由李庆云,崔景宇和Juhan Nam撰写的论文“重新审视歌声检测:定量审查和未来展望”的代码。[ ,] 要求 在requirements.txt中指定 公开数据集 具有相同的标签,训练/有效/测试集,如网站中所述。 我们使用了61首包含人声的歌曲,这些歌曲可以在medleydb_vocal_songs.txt找到。 注意:MedleyDB不提供人声注释,因此我们使用提供的乐器激活注释生成了标签。 下载歌曲,更改路径,然后运行python medley_voice_label.py生成61首歌曲的标签。 压力测试数据集(第5节) 要生成数据集,请运行 第5.1节中的python vibrato_data_gen.py vibrato测试的python vibrato_data_ge
1
该存储库包含用于各种光学音乐识别任务的许多数据集的集合,包括人员线检测和删除,卷积神经元网络(CNN)的训练或通过将系统与已知的真实情况进行比较来验证现有系统。 请注意,大多数数据集都是由研究人员开发的,使用它们的数据集需要接受一定的许可和/或引用各自的出版物,如每个数据集所示。 大多数数据集都链接到官方网站,您可以在其中下载数据集。 如果您对光学音乐识别研究感兴趣,可以在找到精选的书目。 概述 该存储库引用了以下数据集: 名称 雕刻 尺寸 格式 典型用法 手写的 15200个符号 文本文件 符号分类(在线+离线) 排版+手写 〜90000个符号 图片 符号分类(离线) 手写的 1000个分数图像 图片 撤职人员,作家身份证明 手写的 > 90000条注释 图像,度量注释,MuNG 符号分类,对象检测,端到端识别,量度识别 排字 300000图片 图片,XML 符号分类,对象
1