CSTR语音克隆英语多说话人语料库工具包 概述 这个CSTR VCTK语料库包含了109个以不同口音为母语的英语使用者的语音数据。 每位演讲者要朗读大约400句句子,其中大部分是从报纸上挑选出来的,再加上彩虹段落和一段旨在识别演讲者口音的启事段落。 这些报纸文本是在先驱时报集团(Herald & Times Group)的许可下,从格拉斯哥的《先驱报》(The Herald)上摘取的。 每位演讲者阅读一组不同的报纸句子,每组句子都是通过贪婪算法选择的,该算法旨在最大限度地扩大上下文和语音覆盖范围。 彩虹段落和启发性段落对所有演讲者都是一样的。 彩虹之旅可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中找到。 引出段落与用于语音重音存档(http://accent.gmu.edu)的段落相同。 语音口音档案的细节可以在http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf上找到 所有的语音数据都是使用相同的录音设置记录的:一个全向头戴式麦克风(DPA 4035),采样频率为96kHz, 24位,在爱丁堡大学的半暗室中。 所有录音均转换为16位,基于STPK下采样至48 kHz,并手动端点。 该语料库的录制是为了构建基于hmm的文本-语音合成系统,特别是用于使用多个发言者训练的平均语音模型和发言者自适应技术构建基于发言者自适应的语音合成系统。 复制 该语料库是在开放数据共享署名许可(ODC-By) v1.0下授权的。 http://opendatacommons.org/licenses/by/1.0/ http://opendatacommons.org/licenses/by/summary/ 下载 http://dx.doi.org/10.7488/ds/1994 确认 CSTR VCTK语料库由: Christophe Veaux(爱丁堡大学) Junichi Yamagishi(爱丁堡大学) 克里斯汀•麦克唐纳 导致这些结果的研究部分得到了EPSRC EP/I031022/1 (NST)和EP/J002526/1 (CAF)的资助,来自RSE-NSFC的资助(61111130120)和JST CREST (uDialogue)的资助。
2021-12-15 17:00:37 838B VCTK dataset 语音识别 语音数据集
1
VidTIMIT数据集由43人背诵短句的视频和相应的音频记录组成。 它可以用于唇读、多视角人脸识别、多模态语音识别和人脸识别等领域的研究。 数据集记录在3个会话中,会话1和会话2之间的平均延迟为7天,会话2和会话3之间的平均延迟为6天。 这些句子是从TIMIT语料库的测试部分选择的。 每人有10个句子。 前6个句子(按文件名按字母数字排序)分配给会话1。 接下来的两句话分配给会话2,剩下的两句话分配给会话3。 所有人的前两句话都是一样的,剩下的八句话则因人而异。 除了句子之外,每个人在每个环节都要进行头部旋转。 这个序列包括人向左,向右,回到中心,向上,然后向下,最后回到中心。 录音是在办公环境中使用广播质量的数字摄像机进行的。 每个人的视频被存储为一个编号序列的JPEG图像,分辨率为512 x 384像素。 在JPEG图像的创建过程中使用了90%的质量设置。 相应的音频存储为单声道,16位,32千赫WAV文件。
2021-12-15 17:00:37 837B Audiodataset VidTIMIT
1
信用卡模糊检测kaggle--数据集 背景信息信用卡公司必须能够识别欺诈性的信用卡交易,以免向客户收取未购买商品的费用,这一点很重要。 内容数据集包含欧洲持卡人在2013年9月使用信用卡进行的交易。 该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。 数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172%。 它仅包含数字输入变量,它们是PCA转换的结果。 遗憾的是,由于机密性问题,我们无法提供有关数据的原始功能和更多背景信息。 功能部件V1,V2,...,V28是PCA获得的主要组件,尚未通过PCA转换的唯一功能部件是“时间”和“量”。 功能“时间”包含数据集中每个事务和第一个事务之间经过的秒数。 功能“金额”是交易金额,此功能可用于与示例相关的成本敏感型学习。 特征“类别”是响应变量,在发生欺诈时其值为1,否则为0。 启示识别欺诈性的信用卡交易。
2021-12-15 11:58:49 216KB JupyterNotebook
1
imu_comparison_data:论文的数据和代码基于惯性传感器的运动跟踪方法调查:以上肢人类运动为重点
2021-12-14 22:48:16 131.48MB code matlab comparison dataset
1
:flower_playing_cards: AVA数据集 大规模的审美视觉分析数据库 数据集下载 通过Mega或Torrent下载 :cloud: 巨型云 链接: 整个数据集已拆分为64个7z文件。 下载所有zip文件,解压缩第一个文件,它应该可以工作。 约32GB和255,500个图片文件。 :link: 激流 下载并与或其他客户端打开。 还支持磁铁链接。 有关更多详细信息,请访问 。 注意:由于torrent服务器的网络状况,下载过程可能会不稳定。 如果是这样,请改用Mega。 Bibtex: @article{, title= {AVA: A Large-Scale Database for Aesthetic Visual Analysis}, keywords= {images, aesthetics, semantic, quality, AVA, DPChallenge}, journal= {}, author= {N
2021-12-14 16:04:10 4.22MB python computer-vision dataset ava
1
NXP IMX8M MINI 数据手册中文版,带目录,您玩机的必备资料!由官方资料翻译而来,对查阅手册,定位章节有很大的帮助,绝对的干货!英文菜鸟的福音!
2021-12-13 21:47:33 69.91MB 嵌入式 nxp dataset
1
The data is composed of solar wind measurements collected from two satellites: NASA's Advanced Composition Explorer (ACE) and NOAA's Deep Space Climate Observatory (DSCOVR). 数据由从两颗卫星收集的太阳风测量数据组成:NASA的高级成分探测器(ACE)和NOAA的深空气候观测站(DSCOVR)。 satellite_pos.csv sunspots.csv labels.csv solar_wind.csv
2021-12-13 10:36:49 274.47MB 数据集
1
[情感分析] Yelp数据集的综合情感分析 对Yelp_Dataset的综合情感分析 下载Yelp数据集以进行大规模数据分析,包括情绪,多年分布和一个月分布。 包括: - 情绪分析。 数据清理。 数据预处理。 数月,数年的正面,负面,中性评论分布。 下载输出文件夹,以了解此python程序的确切功能。
2021-12-13 00:44:29 1.96MB Python
1
1039组-美国婴儿名字趋势 大事记 里程碑的详细信息可在Canvas(左侧的侧边栏,Course Project)上或。 用大约150-200个字词描述您的主题/兴趣 我们选择此美国婴儿名字数据集,是因为有趣的是在整个100年中看到了特定区域的命名趋势。 该数据集收集了1990年代至2014年美国各州和国家/地区的婴儿名字。我们将分析州/州/地区数据集,并比较各州之间最受欢迎和最不受欢迎的婴儿名字,以通过地理位置了解相似之处。 还将分析国家一级的数据集,以查看100年来是否存在总体命名趋势。 可以通过比较给定时间段内最受欢迎的男孩/女孩的名字来完成。 最终,我们可以比较州和国家级数据集,并查看哪个州的命名趋势与国家趋势最相似。 当然,从分析中可以回答许多有趣的问题。 我们期待着通过查看近年来和各性别的命名趋势来预测新生儿的名字是否可能。 通过仪表板工具构建GUI,可以公开查看我们从该数
2021-12-09 23:13:50 1.98MB dataset trend baby-naming JupyterNotebook
1
使用情况和数据集可用性 可以从此下载数据集。此存储库中的数据只是从原始数据集文件夹中包含的.mat文件中提取的图像。 创建该存储库是为了便于我对数据集进行在线访问。 CUHK-03数据集说明 此数据集是从香港中文大学(CUHK)校园收集的,请参考中大法规使用。 它包含敏感数据,使用时应尊重中大学生的隐私。 数据存储在MATLAB MAT文件“ cuhk-03.mat”中。 从5对不同的摄像机视图中收集了1467个身份。 “ cuhk-03.mat”包含三个单元格。 “检测到”表示边界框由行人检测器估算 “标记的”是指边界框被人标记 “测试集”包含测试协议 每个的详细信息在下面列出。 “检测到”和“已标记” 5 x 1个像元,每个像元包含从一对摄像机视图收集的数据。 每对摄影机视图均由M x 10个像元组成,其中M是标识的数量。 对于每个标识,单元格1-5是来自一个摄像机的图像,而单元
2021-12-09 22:05:39 362.5MB dataset cuhk person-reidentification Python
1