CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dict.txt为统计的字典。 test.ipnb用于测试模型性能。 数据集使用的是清华的数据集,下载后放在项目同级目录即可运行
2022-05-05 21:28:36 796.43MB CNN+CTC_tutorial
1
语音识别基于matlab的程序代码,经调试可用
2022-05-05 19:55:08 3KB matlab 语音识别 程序代码
1
java语音视频聊天程序.zip
2022-05-05 14:42:21 2.37MB java 语音识别
1
微信小程序的语音输入,语音转文字功能在很多场景要使用到 比如搜索框,搜索关键字的时候用语音输入比用文字方便多了 再比如再天下网吧小程序里发帖,发布回复时,用语音输入比输入文字也方便不少 那么如何实现语音输入,小程序语音转文字功能呢? 一起来下载
2022-05-05 07:04:55 11KB 微信小程序 语音识别 语音转文字
1
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
2022-05-05 01:18:20 17.5MB C++ 语音识别
1
语音识别技术越来越多地用于电话应用,例如旅行预订和信息,金融帐户信息,客户服务呼叫路由和目录服务。 使用受约束的语法识别,此类应用程序可以实现非常高的准确性。 随着实现这种语音激活系统的成本下降并且这些系统的实用性和有效性得到了提高,语音识别技术的研究和开发持续增长。 例如,为电话应用程序优化的识别系统通常可以提供有关特定识别的置信度的信息,如果置信度低,则可以触发该应用程序以提示呼叫者确认或重复他们的请求。 索引词:语音,识别,验证,声音,孤立,单词。
2022-05-04 23:23:10 1.69MB 开源软件
1
语音识别项目中使用到的数据集,直接解压到项目根目录即可运行程序
2022-05-04 21:33:22 17.62MB 语音识别 深度学习
1
口语情感识别数据集:语音中情感识别/检测目的的数据集的集合。 该表按时间顺序排列,并包含每个数据集内容的描述以及所包含的情感。 数据集 年 内容 情绪化 格式 尺寸 语 纸 使用权 执照 2021年 40小时,由70多位讲英语的人提供6,000多个25,000多个句子的6,000多个录音(有关详细信息,请参见数据库链接)。 以价,唤醒和可信赖为特征的连续情感维度。 音频,视频,文字 15 GB 英语 禁止进入 根据学术许可和商业许可提供 2020年 超过100位演讲者提供了100小时的服务(有关详情,请参见数据库链接)。 该语料库使用基于属性的描述符(激活,支配和价)和分类标签(愤怒,幸福,悲伤,厌恶,惊讶,恐惧,鄙视,中立等)用情感标签进行注释。 声音的 -- -- 禁止进入 根据学术许可和商业许可提供 2020年 各种各样的发言人录制的唱片及其相关的录音作品。 4种情
2022-05-04 18:48:24 15KB speech databases datasets emotions
1
基于深度学习的噪声抑制与语音识别系统功能如下 1、噪声抑制: (1)提供对音频进行转换成频谱图,让用户分析起来更加直观。 (2)可以进行录音,并将录进的音频内容保存到指定的文件夹中。 (3)同时可以对录进的音频进行添加噪音,添加研究内容。 (4)可以对录制的音频进行降噪处理,使录进的音频听起来更加清晰。 (5)可以将处理后的音频播放出来。 2、语音合成: (1)提供对用户想输入的两段文字的编辑功能。 (2)可以将用户输入的两段文字合成为一段文字并将文字转换为音频信息。 (3)可以存取转换后的音频,也可以存取任意一段文字所转换的音频。 (4)可以将存取的音频播放出来 3、语音识别: (1)提供对于用户输入的音频进行录制。 (2)可以将用户录入的音频存储到指定路径中并进行播放。 (3)将存储的音频识别成文字的方式进行输出。 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音
2022-05-04 12:06:25 17.82MB 源码软件 深度学习 语音识别 人工智能
这个是做毕设老师提供的代码,我试了一下,还得修改,会的请多多指教.
2022-05-03 22:00:29 2.02MB RBF
1