语音识别技术越来越多地用于电话应用,例如旅行预订和信息,金融帐户信息,客户服务呼叫路由和目录服务。 使用受约束的语法识别,此类应用程序可以实现非常高的准确性。 随着实现这种语音激活系统的成本下降并且这些系统的实用性和有效性得到了提高,语音识别技术的研究和开发持续增长。 例如,为电话应用程序优化的识别系统通常可以提供有关特定识别的置信度的信息,如果置信度低,则可以触发该应用程序以提示呼叫者确认或重复他们的请求。 索引词:语音,识别,验证,声音,孤立,单词。
2022-05-04 23:23:10 1.69MB 开源软件
1
语音识别项目中使用到的数据集,直接解压到项目根目录即可运行程序
2022-05-04 21:33:22 17.62MB 语音识别 深度学习
1
口语情感识别数据集:语音中情感识别/检测目的的数据集的集合。 该表按时间顺序排列,并包含每个数据集内容的描述以及所包含的情感。 数据集 年 内容 情绪化 格式 尺寸 语 纸 使用权 执照 2021年 40小时,由70多位讲英语的人提供6,000多个25,000多个句子的6,000多个录音(有关详细信息,请参见数据库链接)。 以价,唤醒和可信赖为特征的连续情感维度。 音频,视频,文字 15 GB 英语 禁止进入 根据学术许可和商业许可提供 2020年 超过100位演讲者提供了100小时的服务(有关详情,请参见数据库链接)。 该语料库使用基于属性的描述符(激活,支配和价)和分类标签(愤怒,幸福,悲伤,厌恶,惊讶,恐惧,鄙视,中立等)用情感标签进行注释。 声音的 -- -- 禁止进入 根据学术许可和商业许可提供 2020年 各种各样的发言人录制的唱片及其相关的录音作品。 4种情
2022-05-04 18:48:24 15KB speech databases datasets emotions
1
基于深度学习的噪声抑制与语音识别系统功能如下 1、噪声抑制: (1)提供对音频进行转换成频谱图,让用户分析起来更加直观。 (2)可以进行录音,并将录进的音频内容保存到指定的文件夹中。 (3)同时可以对录进的音频进行添加噪音,添加研究内容。 (4)可以对录制的音频进行降噪处理,使录进的音频听起来更加清晰。 (5)可以将处理后的音频播放出来。 2、语音合成: (1)提供对用户想输入的两段文字的编辑功能。 (2)可以将用户输入的两段文字合成为一段文字并将文字转换为音频信息。 (3)可以存取转换后的音频,也可以存取任意一段文字所转换的音频。 (4)可以将存取的音频播放出来 3、语音识别: (1)提供对于用户输入的音频进行录制。 (2)可以将用户录入的音频存储到指定路径中并进行播放。 (3)将存储的音频识别成文字的方式进行输出。 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音
2022-05-04 12:06:25 17.82MB 源码软件 深度学习 语音识别 人工智能
这个是做毕设老师提供的代码,我试了一下,还得修改,会的请多多指教.
2022-05-03 22:00:29 2.02MB RBF
1
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN 模型能得到比基于状态的同步和异步DBN 模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性。
2022-05-03 12:43:40 69KB 工程技术 论文
1
电子-语音识别模块原理图.pdf,单片机/嵌入式STM32-F0/F1/F2
2022-05-01 21:30:08 52KB 单片机/嵌入式STM32-F0/F1/F2专区
1
语音识别中dtw算法详解,用于声纹识别时非常有用
1
微软的语音识别,在这里我们简称它为SR(speech recognition),SR分为两种模式的监听:第一种模式:任意监听,即随意输入语音,监听对象将最为接近的字或者词,句反馈出来;
2022-04-30 19:06:56 4KB 使用C++实现语音识别
1
基于matlab的代码,可以直接运行的代码,不需要修改什么内容,适合快速上手,并基于此demo快速迭代改进,珍藏许久的资源。
2022-04-30 00:20:15 18.58MB 人工智能 机器学习 语音识别
1