LaboroTVSpeech
电视录音中的大型日语语音语料库
关于语料库
LaboroTVSpeech是一种大型的日语语音语料库,由广播的电视录音及其字幕构建而成。 我们当前的版本包含超过2,000个小时的演讲时间。
细节
所有音频样本均基于原始字幕的音域进行了细分,采样率为16 KHz。
使用和作为字典,将每个语音段标记为单词序列。
每个单词标记都包含一个简单的语素标记,例如名词(名词)或动词(动词),它们是通过预处理原始字幕获得的。
从原始的电视音频和字幕中,我们提取了语音段,从而能够以较高的置信度对齐音频和字幕段。
我们反复使用和 。
所有语音片段均随机洗牌。
子集
火车
开发者
音频长度(小时)
2036.2
13.7
#音频片段
160万
12 K
#单词(令牌)
2 200万
147千
预防
某些单词的发音或语素标记可能不正确,尤其是对于随意单词。 例如「
2022-05-07 19:08:24
58KB
Shell
1