行业分类-嵌入式设备-用于具有用户可定义约束的小型语音识别的构造的嵌入式系统.zip
负性情绪对于临床治疗的效果有着巨大影响.语音是人类表达情绪的主要方式之一,通过语音识别患者的情绪状态,可以帮助我们更简便、更快捷地监控病人的情绪,从而可以更快更有效地采取措施降低负面情绪带来的不良影响。对一种改进BP神经网络进行了扩展,拓展了用于情感识别的语音特征向量的冗余度,采取主成分分析方法对语音特征向量进行降维处理,并对语音样本进行去野点处理,从而使得该BP网络同时具备了对于愤怒和悲伤两种负性情绪的良好识别能力。
2021-08-20 20:50:21 426KB 自然科学 论文
1
来源于开源代码flyPanda/txt-to-voice,处理并修复了部分问题,用的百度api,能将文本转成mp3格式,这里生成的路径按照章节提取文本
2021-08-20 19:11:55 417KB 语音识别 文本转语音 小说转语音
1
行业分类-电信-两级式语音识别电话号码呼出装置.rar
lstm ctc 语音识别
2021-08-20 13:01:23 297B lstm 语音识别
1
基于k-means聚类的快速LDA算法在语音识别上的应用.pdf
2021-08-20 09:13:42 234KB 聚类 算法 数据结构 参考文献
语音转写基于科大讯飞WebApi接口的安卓实现--上传录音音频翻译成文字 实现方法链接:https://blog.csdn.net/qq_33315364/article/details/104668152#comments_12152992
2021-08-19 21:03:28 6.63MB android 语音转写 语音识别 科大讯飞
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
Unity插件。语音识别(离线版)插件。支持中文、英文、俄语、法语、阿拉伯语等19种语言。支持多平台(PC、移动端)。
2021-08-18 17:43:23 48.76MB Unity 语音识别 离线 Unity插件
包括tensorflow官方训练的四个模型和官方编译的库文件:物体识别、多重行人检测、图像风格转换、语音识别、libtensorflow_inference.so库文件和libandroid_tensorflow_inference_java.jar库文件包含jdk7版本和jdk8版本,我的项目用jdk8报错,因为我环境低,换了jdk7的就好了,所以这里给大家都提供下,各取所需吧。
2021-08-18 17:11:43 87MB TensorFlow Android 模型文件 so库文件
1