是一篇很好的关于语音情感识别的文献综述,讲的很详细,逻辑性很强。
2022-11-26 14:55:03 1.05MB 语音情感识别
1
搭建SIP局域网语音通话个工具合集 mini SIP Server V37 windows服务器、 Sip Serve 2008 windows服务器、 X-Lite windows客户端 sip droid 安卓客户端
1
语音识别专利技术发展现状与未来趋势,可用于语言识别等方面论文的参考
2022-11-25 12:26:53 2.36MB 语音识别
1
解决电脑不能读中文的问题和应用TTS开发语音程序,不能读中文的问题。安装后,会自动添加中文发音。你可以在如下路径查看:控制面板---》语音。精简,仅有1.5M。
2022-11-25 02:32:29 1.43MB TTS发音引擎
1
课题为基于模板匹配的语音播报汽车牌照识别,流程为:读取车牌,灰度处理,边缘检测,形态学处理,投影法车牌定位,车牌灰度化,连通域法字符切割,模板匹配字符识别。整个设计含有一个GUI可视化界面。传统的课题基本都是直接对着矩形车牌进行识别,毫无新意,设计很难通过。因此建议增加新的元素。如:增加语音播报,增加判别识别率,库内外预警,停车费收费信息,多车牌计数识别等等。该课题增加元素为语音播报功能,可以录制属于自己的声音。
1
NXP MCU级别的本地语音控制解决方案利用i.MX RT106L来实现,该方案可以使开发者更方便和快速地将本地语音命令添加到他们的产品。这个超小尺寸,集成软件算法和硬件的方案,可以方便开发者进行快速的评估和概念验证开发。在智能音响,智能家居等产品开发中,开发者可使用示例中的指令集和唤醒词,也可以向NXP申请创建自定义指令集和唤醒词。这个解决方案上缩短了上市时间,降低了风险并减少了开发工作,可以使众多OEM工厂轻松地将语音指令添加到其智能家居和智能设备中去,无需连接wifi和云,从而解决了很多消费者的隐私问题。  i.MX RT106L是i.MX RT1060系列的成员,将于2020年4月份正
1
包括 AISHELL-1_sample数据集 和词典
2022-11-24 20:02:44 98.82MB 语音识别 kaldi aishell1数据集
1
Lite视听语音增强(Interspeech 2020) 介绍 这是的PyTorch实现。 我们还将一些预处理后的样本数据(包括增强的结果)放入此存储库中。 TMSV的LAVSE使用的数据集(台湾汉语语音与视频)发布。 如果您发现对研究有用的代码,请引用以下论文。 @inproceedings{chuang2020lite, title={Lite Audio-Visual Speech Enhancement}, author={Chuang, Shang-Yi and Tsao, Yu and Lo, Chen-Chou and Wang, Hsin-Min}, booktitle={Proc. Interspeech 2020} } 先决条件 Ubuntu 18.04 Python 3.6 CUDA 10 您可以使用pip安装Python代理。 pip i
2022-11-24 16:57:44 9.48MB Python
1
使用科大讯飞语音合成api批量生成不同发音人、不同提示音内容的小程序,根据自身需求,只需要改动发音人、提示音内容两个txt文件,操作简单快捷
2022-11-24 13:50:31 7.53MB 科大讯飞 语音合成 批量生成
1
BP神经网络的数据分类(Matlab完整程序和数据) BP神经网络的数据分类(Matlab完整程序和数据) BP神经网络的数据分类(Matlab完整程序和数据) BP神经网络的数据分类——语音特征信号分类 BP神经网络的数据分类——语音特征信号分类