CSTR VCTK Corpusu国内源下载

VCTK dataset 语音识别语音数据集

CSTR语音克隆英语多说话人语料库工具包概述这个CSTR VCTK语料库包含了109个以不同口音为母语的英语使用者的语音数据。每位演讲者要朗读大约400句句子，其中大部分是从报纸上挑选出来的，再加上彩虹段落和一段旨在识别演讲者口音的启事段落。这些报纸文本是在先驱时报集团(Herald & Times Group)的许可下，从格拉斯哥的《先驱报》(The Herald)上摘取的。每位演讲者阅读一组不同的报纸句子，每组句子都是通过贪婪算法选择的，该算法旨在最大限度地扩大上下文和语音覆盖范围。彩虹段落和启发性段落对所有演讲者都是一样的。彩虹之旅可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中找到。引出段落与用于语音重音存档(http://accent.gmu.edu)的段落相同。语音口音档案的细节可以在http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf上找到所有的语音数据都是使用相同的录音设置记录的:一个全向头戴式麦克风(DPA 4035)，采样频率为96kHz, 24位，在爱丁堡大学的半暗室中。所有录音均转换为16位，基于STPK下采样至48 kHz，并手动端点。该语料库的录制是为了构建基于hmm的文本-语音合成系统，特别是用于使用多个发言者训练的平均语音模型和发言者自适应技术构建基于发言者自适应的语音合成系统。复制该语料库是在开放数据共享署名许可(ODC-By) v1.0下授权的。 http://opendatacommons.org/licenses/by/1.0/ http://opendatacommons.org/licenses/by/summary/ 下载 http://dx.doi.org/10.7488/ds/1994 确认 CSTR VCTK语料库由: Christophe Veaux(爱丁堡大学) Junichi Yamagishi(爱丁堡大学) 克里斯汀•麦克唐纳导致这些结果的研究部分得到了EPSRC EP/I031022/1 (NST)和EP/J002526/1 (CAF)的资助，来自RSE-NSFC的资助(61111130120)和JST CREST (uDialogue)的资助。

文件下载

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

CSTR VCTK Corpusu国内源下载

文件下载

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载