搜索【SPEECH】的结果

speech.tar.gz

基于百度语音开发的4麦克风阵列程序，里面包含了语音识别，语义理解，语音合成，播放等。是一个完整的案例，初学者可以参考下。

2021-06-16 09:11:01 5.62MB 语音识别

1

语音识别数据集-speech analytic--性别识别--Voice Gender Detection using GMMs-2

使用说明在这里：https://blog.csdn.net/yj13811596648/article/details/88737623

2021-06-15 10:02:02 143.03MB 语音识别 性别识别 GMM

1

语音识别数据集-speech analytic--性别识别--Voice Gender Detection using GMMs-1

使用说明在这里 https://blog.csdn.net/yj13811596648/article/details/88737623

2021-06-15 10:01:36 160.15MB speech 语音识别 性别识别 语音分析

1

Speech-Emotion-Classification-with-PyTorch-master.zip

Speech-Emotion-Classification-with-PyTorch 四种分类网络准确率都高达94 最高为96

2021-06-11 18:07:54 6.25MB 语音情感分类

修复win7不能使用Micosoft Speech Object Library Version5.1

xp下用Micosoft Speech Object Library Version5.1开发的语音软件在win7下不能正常使用，或visual studio 2013不能调用语音开发包。偶然所得本程序，可修复所述问题，请安装。修复XP,Win7系统下不能使用TTS语音引擎的问题精简版Win7,XP,尤其从网上下载的ghost版本的系统 TTS语音引擎多数被阉割,导致很多语音程序无法进行语音朗读。从Microsoft Speech SDK 5.1中提取打包而成。安装此程序即可修复。

2021-06-11 14:36:36 4.16MB Win7 TTS语音引擎

1

语音控制MP3播放

使用system.speech进行语音控制编程，能够进行语音控制播放（play music）、打开文件（open file）、暂停（pause music）、关闭播放器（close music）。

2021-06-11 09:05:15 13.3MB speech sapi 语音识别 语音控制

1

C#语音识别系统speechsdk51，SpeechSDK51LangPack

配置字词，有限的进行语音识别，增加准确率！

2021-06-09 19:13:34 145KB Speech

1

CycleGAN-VC2:CycleGAN（语音克隆语音转换）进行的语音转换-源码

CycleGAN-VC2-PyTorch | 这段代码是用于纸张的PyTorch实现：，是有关语音转换/语音克隆的工作。数据集风投中国男性演讲者（AISHELL 和）用法训练例子演示版参考更新 2020.11.17 ：修复的问题：重新实施第二步的逆向损失。 2020.08.27 ：通过添加第二步的逆向性损失循环GAN-VC2 为了推进非并行VC的研究，我们提出了CycleGAN-VC2，它是CycleGAN-VC的改进版本，结合了三种新技术：改进的目标（两步对抗损失），改进的生成器（2-1-2D CNN））和改进的鉴别器（GAN修补程序）。该存储库包含：实施本文的。，可用于创建缓存。来训练模型。 -训练后转换的结果。目录要求 pip install -r requirements.txt 用法预处理 python pre

2021-06-08 10:23:53 87.12MB deep-learning speech-synthesis gan deeplearning

1

SpecAugment：由Tensorflow和Pytorch实现的SpecAugment，由Google Brain介绍

规格这是SpecAugment的一种实现，该语音数据增强方法可直接使用Tensorflow＆Pytorch处理频谱图，这是Google Brain提出的[1]。当前在Apache 2.0中使用，请随时用于您的项目。请享用！如何使用首先，您需要与一起安装python 3。接下来，您需要安装一些音频库才能正常工作。安装需求包。运行以下命令： pip3 install SpecAugment 然后，运行specAugment.py程序。它通过在时间方向上扭曲频谱图，掩盖连续频道的块以及掩盖时间上的话语来修改频谱图。尝试您的音频文件SpecAugment $ python

2021-05-26 10:29:49 237KB python tensorflow speech pytorch

1

Acoustic MIMO signal processing 书

Acoustic MIMO signal processing 书作者 Y. Huang, J. Benesty, J. Chen

2021-05-22 21:27:07 4.26MB Acoustic MIMO signal speech

1

个人信息

热门下载

最新下载

其他资源