基于深度学习的语音识别实战课程主要包括三部分内容:1.经典论文算法讲解;2.算法源码解读;3.项目实战;通俗讲解语音识别领域当下经典论文思想,详细解读源码中每一核心模块并基于真实数据集展开项目实战。整体课程覆盖语音识别领域四大核心主题:语音识别,语音分离,语音转换,语音合成;每一主题均按照论文思想解读,源码分析,项目实战顺序进行讲解。提供课程所需全部数据集,代码,PPT课件。
1
定位相关的Tacotron 的PyTorch实现。 音频样本可以在找到。 可以在找到Colab演示。 图1: Tacotron(具有动态卷积注意)。 图2:示例梅尔谱图和注意图。 快速开始 确保您已安装Python 3.6和PyTorch 1.7或更高版本。 然后安装此软件包(以及): pip install tacotron univoc 用法示例 import torch import soundfile as sf from univoc import Vocoder from tacotron import load_cmudict , text_to_id , Tacotron # download pretrained weights for the vocoder (and optionally move to GPU) vocoder = Vocoder .
2022-05-18 18:11:43 1021KB text-to-speech pytorch tts speech-synthesis
1
Python 制作一个儿童学习软件 (附源码和软件下载) 包含语音合成 视频播放 pyqt pptsx3 Qmovie request pygame 音频播放等内容。 在软件开发变得越来越容易的今天,编程新手也可以利用成熟的代码库进行有趣的开发实践,这不,我用近期学习到的python知识,为孩子开发了一个小小的学习软件,利用家里的surface pro4的触摸屏,让孩子能够定期更新学习内容,包含绘本阅读,学习汉字、组词、成语,还能学习英文字母、单词。 基于python3.6.8开发,为了不在开发过程中遇到绕不过的坑导致重新来一遍,只好采用比较稳定保险的python3.6.8来开发,各个模块使用起来都比较正常。 软件利用到了pyqt5、openpyxl、pyttsx3、PIL、pygame等库,重点是用到了PyQt5中的图片显示、布局管理、Qmovie、QvideoWidget等功能,另外还尝试了百度api、微软api制作语音合成,效果很好,孩子说很喜欢 具体用pip install 安装模块 有问题可咨询qq:450995246 帮你解决 共同学习 为了孩子的未来共同发展!
2022-05-17 19:02:55 382.7MB python 源码软件 学习 音视频
首先得要有阿里云账号, 并开通相关的语音合成账号(智能语音交互), 并创建项目,项目类型选;语音合成。在这里能生成AppKey,记住它。 然后去AccessKey管理中找到AccessKey ID和Secret, 这两个东西在获取TOKEN的时候要用到。 最后填写在程序对应的位置上即可。 生成的语音文件在程序的目录里。
2022-05-11 14:29:21 2.33MB C#文字转语音
1
android语音合成demo,非常强大,将demo目录里面的音频文件拷贝到手机SDcard中
2022-05-07 21:05:53 24.26MB 语音合成
1
java调用讯飞接口实现语音合成功能,代码下载下来按照使用说明即可使用
2022-05-07 20:14:20 2.99MB java 讯飞 语音合成
1
一个Android开发集成科大讯飞语音识别+语音合成功能的小Demo
2022-05-07 17:20:05 27.77MB 语音识别
1
该资源是支持训练中文合成系统,也可以直接预测,部署在本地服务器,可以合成歌声。
2022-05-06 20:05:14 11.48MB 深度学习 文档资料 人工智能 语音合成
用了 精易模块 ,调用了百度语音接口,Token改成你们自己的即可。
2022-04-25 01:13:53 321KB 2019开源大赛(第四届)
1
之前有个单子需要用到阿里云的语音合成在论坛里搜索过但是都是不能用的,后面对下载的源码修改了下;
2022-04-25 01:08:40 266KB 2020开源大赛(第五届)
1