Text to Speech with delphi
2022-09-21 13:01:32 9KB delphi_tts speech_to_text tts
Speech2Text 在这里使用ffmpeg / flac / Google和ruby的功能是一个简单的界面,可以将语音转换为文本。 在本文的帮助下,使用来自Google的新的未记录语音API: / 我们能够在Ruby中提供一个非常简单的API,以将简单的音频解码为文本。 Google的API尚未公开,因此可能会更改。 它似乎也非常脆弱,因为它多次返回500,因此该库具有内置的重试代码-对于较大的音频文件,可能会在检索成功结果之前返回10多个失败… 似乎API也只喜欢较小的音频文件,因此有一个内置的分块器,使我们可以将音频分成较小的块。 安装 将此行添加到您的应用程序的Gemfile中: gem 'speech2text' 然后执行: $ bundle 或将其自己安装为: $ gem install speech2text 您还必须在本地计算机上安装ffmpeg
2022-09-07 11:05:43 1.88MB Ruby
1
speech_recognition:适用于Python的语音识别模块,支持在线和离线的多个引擎和API
2022-05-15 21:31:48 119.55MB audio python speech-recognition speech-to-text
1
演讲演示 项目地址: : 文档地址: 语音识别: ://ai.baidu.com/docs#/ASR-API/top 语音合成: ://ai.baidu.com/docs#/TTS-API/top 百度语音rest api调用语音识别,语音合成示例 Rest API接口为http访问,任意操作系统,任意语言,只要能对baidu域名发起http请求的,均可以使用。 百度语音合成的接口支持跨域,但是获取令牌的接口不支持。浏览器直接发请求的示例见: : 简介 以JAVA PHP python C BASH作为示例,展示api的调用过程,选择一个运行即可。 目录结构 +--rest-api
2022-03-09 20:04:55 3.02MB rest-api speech-recognition baidu speech-to-text
1
混合语言语音识别 来自团队: 当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。 - 表中的内容: 目录说明 代码开关: 包含用于构建系统的脚本 描述: LDC2015S04,我们的数据集描述 笔记: 我们关于Kaldi相关timit研究笔记,包括timit和librispeech 建立系统的资源 数据源: 基准模型文件: 其他与代码转换有关的论文: 功能改进相关论文: 有趣的Python Kaldi包装器将被检查: 卡尔迪推荐的食谱要检查: 卡尔迪资源: 卡尔迪(Kaldi)范例 解码 数据准备: 文档名称: 图案
2021-12-07 13:45:37 1.07GB 系统开源
1
使用WaveNet进行语音转文字 仍然需要弄清楚CTCLoss的南问题 基于DeepMind论文: 语音识别实现。 此实现的目的是结构合理,可重用且易于理解。 这里的流实现: 尽管WaveNet被设计为“文本到语音”模型,但该论文提到他们也在语音识别任务中对其进行了测试。 他们没有提供有关实现的具体细节,只是表明他们通过直接在TIMIT上对原始音频进行训练的模型在测试数据集上达到了18.8 PER。 我从修改了WaveNet模型,并将的语音识别实验。 下图显示了最终的体系结构。 (图片来源: ) 先决条件 系统 Linux CPU或(NVIDIA GPU + CUDA CuDNN) Python 3.6 图书馆 PyTorch = 0.4.0 librosa = 0.5.0 熊猫> = 0.19.2 == 0.11.0 数据集 我们使用了 , 和语料库。 由上
2021-11-18 20:12:04 216KB Python
1
c# 用SAPI实现语音识别及文本转换的详细教程 每一步都特别详细 相信看完之后 语音识别这快就没问题了 翻译的可能有些问题
2019-12-21 19:34:37 873KB c# speech to text语音识别
1