口语情感识别数据集:语音中情感识别/检测目的的数据集的集合。 该表按时间顺序排列,并包含每个数据集内容的描述以及所包含的情感。 数据集 年 内容 情绪化 格式 尺寸 语 纸 使用权 执照 2021年 40小时,由70多位讲英语的人提供6,000多个25,000多个句子的6,000多个录音(有关详细信息,请参见数据库链接)。 以价,唤醒和可信赖为特征的连续情感维度。 音频,视频,文字 15 GB 英语 禁止进入 根据学术许可和商业许可提供 2020年 超过100位演讲者提供了100小时的服务(有关详情,请参见数据库链接)。 该语料库使用基于属性的描述符(激活,支配和价)和分类标签(愤怒,幸福,悲伤,厌恶,惊讶,恐惧,鄙视,中立等)用情感标签进行注释。 声音的 -- -- 禁止进入 根据学术许可和商业许可提供 2020年 各种各样的发言人录制的唱片及其相关的录音作品。 4种情
2022-05-04 18:48:24 15KB speech databases datasets emotions
1
口语数字识别 :studio_microphone: LSTM语音数字识别 内容 概述 语音数字识别是一个隔离的单词识别系统,可转录0-9之间的各个语音号码。 数据集 使用免费语音数字数据集(FSDD)来训练该模型,该模型具有来自3位讲英语且带有重音的扬声器的1,500张录音。 该模型接受了1,470张唱片的训练,并在30张唱片上进行了测试。 模型与训练 该模型包括: LSTM层 全连接层 损失函数:分类交叉熵 优化算法:亚当 模型在300个时代进行了训练。 改进和要添加的功能 数据集需要更多不同类型的发言人,包括不同性别和不同口音的人,以便该系统在世界范围内正常运行 模型本身可以改进 使用更好的培训/测试策略 具有使用自己的声音来测试模型的界面,使前端易于与模型进行交互 改善模型性能 基本上,这是我的实验,旨在了解如何构建仅检测语音数字的语音识别系统。 用法 python spoke_digit.py为了运行
1
Speech enhancement based on adaptive wavelet denoising on multitaper spectrum matlab
2022-04-29 18:07:24 1.82MB 源码软件 matlab
NLP领域经典《自然语言处理综论》英文版第三版更新,与之前的版本相比,重写了5、6、7、8、17、18、19、23、24、25章节的大部分内容和并新增了第9章节“递归神经网络中的序列处理(Sequence Processing with Recurrent Networks)”的草稿;调整了神经网络及其训练的教学顺序,从逻辑回归开始,到(词)嵌入,前馈网络以及递归神经网络;新增或者加大了BPE处理、tf-idf、柱搜索解码、隐马尔可夫模型、词典推理、阅读理解、自动问答等内容;一些旧的章节被移到附录。
2022-04-26 12:59:16 17.09MB 自然语言处理 机器学习 深度学习
1
车载语音识别导航系统.车载语音识别导航系统.车载语音识别导航系统.车载语音识别导航系统.
2022-04-25 20:37:16 77KB visaul c++ c++ 语音识别,SAPI,Speech
1
java的简单的文字转语音Speech的简单使用教程. 内附资源下载地址.
2022-04-24 10:22:24 25KB java speech TTS
1
TTS朗读软件调用Microsoft Speech Platform Runtime和Languages
2022-04-11 13:20:29 30.34MB Microsoft Speech Platform Runtime
1
关于幸福主题的,内含演讲稿和ppt,大约3分钟.
2022-04-10 20:22:25 267KB happiness presentation speech
1
《Adaptive Multi-Rate (AMR) speech codec frame structure》
2022-04-06 03:02:01 146KB 网络协议
1
《AMR speech codec, wideband》
2022-04-06 03:02:00 202KB 协议栈
1