免费口语数据集(FSDD) 一个简单的音频/语音数据集,由8kHz的wav文件中的口头录音组成。 修整录音,使其在开始和结束时几乎保持静音。 FSDD是一个开放的数据集,这意味着它将随着时间的推移随着数据的添加而增长。 为了实现可重复性和准确的引用,使用Zenodo DOI和git tags对数据集进行版本控制。 当前状态 6位演讲者 3,000个录音(每个扬声器每个数字50个) 英语发音 组织 文件以以下格式命名: {digitLabel}_{speakerName}_{index}.wav示例: 7_jackson_32.wav 会费 请贡献您的自制录音。 所有录音应为单声道8kHz wav文件,并进行修剪以使静音降至最低。 不要忘记使用发言人元数据更新metadata.py 要添加数据,请按照acquire_data/say_numbers_prompt.py的记录说明进行a
2021-10-07 19:23:06 15.66MB audio machine-learning dataset mnist
1
口语填空和意图检测任务 插槽填充和意图检测的基本模型: 论文“具有焦点机制的编码器-解码器用于基于序列标签的口语理解”的“焦点”部分的实现 。 基于的BLSTM-CRF的实现 插槽填充和意图检测任务联合培训的实施 。 基本型号+ / / 数据集教程: (英语/西班牙语/泰语) (无意图) (无意图) (无意图) 部分 描述 所需的包 如何在ATIS数据集上报告意图检测的性能 教程A:带有预训练的单词嵌入 教程A:使用预训练的单词嵌入进行插槽填充和意图检测 教程B:使用ELMo 教程B:使用ElMo进行插槽填充和意图检测 教程C:使用BERT 教程C:插槽填充和BERT意图检测 教程D:使用XLNET 教程D:使用XLNET进行插槽填充和意图检测 结果 某些数据集上不同方法的结果 推论模式 推论模式 参考 如何引用? 设置 python 3.6.x py
1
黄学东博士著作,介绍了到DNN出现之前的主流语音识别技术,增进对语音处理了解,实属居家旅行必备之良品
2021-06-01 14:30:07 9.64MB 语音处
1
这是语音信号处理领域一本内容很不错的书,我一直在用,很受益。拿出来分享,Enjoy it!
2021-04-30 19:51:06 6.81MB 语音信号处理丛书 pdf
1
语音识别入门教材 微软黄学东 spoken language processing
2021-04-09 20:15:05 9.08MB spoken langu
1
使用说明请看这里:https://blog.csdn.net/yj13811596648/article/details/88746350
2020-03-04 03:17:46 112.79MB 语音识别 说话人识别
1
这是part2 。使用说明看这里:https://blog.csdn.net/yj13811596648/article/details/88746350
2019-12-21 22:12:00 150.17MB 语音识别 说话人识别
1
巨经典的语音识别著作,我千辛万苦找到的
2019-12-21 20:23:04 9.1MB recognition speech
1
由微软的xuedong Huang编写的语音信号处理经典教程,Spoken Language Processing A Guide to Theory Algorithm and System Development
2019-12-21 20:03:48 6.76MB Spoken Langu
1