搜索【Speech 】的结果

MevonAI-Speech-Emotion-Recognition:识别音频段中多个发言人的情绪-源码

MevonAI-语音情感识别识别音频段中多个发言人的情绪· 在这里尝试演示目录说话人二值化特征提取 CNN模型训练模型贡献执照致谢常问问题关于该项目该项目的主要目的是识别呼叫音频中多个说话者的情绪，作为呼叫中心客户满意度反馈的应用程序。建于的Python 3.6.9 Tensorflow-Keras 解放军入门按照以下说明在本地计算机上设置项目。安装创建一个python虚拟环境 sudo apt install python3-venv mkdir mevonAI cd mevonAI python3 -m venv mevon-env source mevon-env/bin/activate 克隆仓库 git clone https://github.com/SuyashMore/MevonAI-Speech-Emotion-Recog

2022-03-04 14:46:22 58.85MB machine-learning deep-learning artificial-intelligence convolutional-neural-networks

1

voxseg:用于语音非语音分段的语音活动检测（VAD）的python库-源码

Voxseg Voxseg是用于语音活动检测（VAD）的Python软件包，用于语音/非语音音频分段。它提供了完整的VAD流水线，包括一个预训练的VAD模型，并且基于介绍的工作。该VAD的使用可引述如下： @inproceedings{cnnbilstm_vad, title = {A hybrid {CNN-BiLSTM} voice activity detector}, author = {Wilkinson, N. and Niesler, T.}, booktitle = {Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)}, year = {2021}, address = {Toronto, Cana

2022-03-02 18:46:08 36.16MB python python-library speech vad

1

Win7系统TTS修复,speech语音测试原码c#.rar

c#speech原码测试，含Win7系统TTS修复-采用原生Win7提取绿修复，直接使用可生成语音文件，朗读

2022-02-27 15:35:38 75.49MB speech 语音

1

微软MicroSoft speech sdk qt demo SpeechToText.rar

下载官方microsoft speech sdk 包括语音包，运行库。sdk镜像。直接安装，运行demo即可。demo已经调通。在前人基础上迁移到qt5,并优化修复了bug.可以正常识别。

2022-02-25 16:59:33 49.55MB qt5 sapi 11 语音识别

1

Windows.Speech.Dictation.dll

系统依赖DLL动态库

2022-02-23 14:00:08 193KB dll

Microsoft Speech

Microsoft Speech语言包

2022-02-21 09:04:53 295.76MB microsoft

1

Speech-Recognition-ANN:使用人工神经网络的语音识别实现-源码

语音识别ANN的实现使用人工神经网络实现语音识别。使用语言：Python 您需要numpy和scipy才能使其正常工作。可以识别的词：“ Apple”，“ Banana”，“ Kiwi”，“ Lime”，“ Orange” ＃如何添加新词在Audacity或任何音频处理软件中记录您的新单词。将采样率设置为44100Hz，然后导出到.wav文件。最好录制许多来自不同扬声器的样本，以提高准确性。将wav文件放入training_sets目录。将您的wav文件重命名为您要添加的单词+ -sample_index（例如：hello-1.wav，hello-2.wav）。这样，特征提取器以后就可以轻松地在文件中进行迭代。在featureExtractor.py中，将新单词附加到单词数组。运行featureExtractor.py。将在mfccData文件夹中生成

2022-02-17 11:07:48 3.63MB Python

1

vqvae-speech:神经离散表示学习（aka VQ-VAE）中描述的语音模型的Tensorflow实现-源码

这是用于语音转换的VQ-VAE模型的实现。到目前为止，结果还不如DeepMind令人印象深刻（您可以找到其结果）。我的估计是语音质量为2-3，清晰度为3-4（按5阶平均意见得分）。欢迎捐款。当前结果音频样本经过50万步训练（约2天）后的结果：来源1：（我们消息感到鼓舞）目标1：资料来源2：（谁是神秘议员？）目标2：资料来源3：（在阿伯丁亚历克斯·弗格森（Alex Ferguson）的下，这是可以做到的。目标3：资料来源4：（那是一个艰辛的时刻。）目标4：笔记：格式：[发言人] _ [句子] 作者没有在上指定目标演讲者。演讲者空间 VQ-VAE学习的扬声器空间的PCA-2D（Tensorboard屏幕截图）。请注意，性别是自然分开的，如Deep Voice 2的图4所示。有趣的是， p280的性别未在VCTK发布的Spea

2022-02-16 13:14:43 155KB Python

1

Speech Recognition_Columbia(哥大最新语音识别讲义)

哥伦比亚大学2016年春季语音识别讲义，覆盖GMM, HMM, 声学模型，语言模型，模型稳健性，深度学习的语音识别等最新知识面

2022-02-15 18:41:42 56.5MB Speech Recognition; 语音识别; ASR

1

语音合成工具 Speech synthesis

语音合成工具 Speech synthesis，支持男声、女声、机器合成声，免安装，亲测可用！！！

2022-02-11 21:42:59 2.51MB 语音合成 支持男音、女 绿色免安装

1

个人信息

热门下载

最新下载

其他资源