搜索【speech-to-text】的结果

Android-Speech-to-Text

适用于 Android 的语音转文本这是语音转文本引擎的基本实现按开始，系统会提示您说些什么。您所说的话将显示在屏幕上并存储在您的手机中。要查看保存的文件，请转到名为“TranscriptionResults”的目录，其中有一个名为“result”的文件每次使用该应用程序时，此文件都会被覆盖

2025-04-17 09:52:26 2.59MB Java

1

TTS.zip_delphi tts_speech to text_tts

Text to Speech with delphi

2022-09-21 13:01:32 9KB delphi_tts speech_to_text tts

speech2text:使用Google Speech to Text API提供一个简单的界面来转换音频文件

Speech2Text 在这里使用ffmpeg / flac / Google和ruby的功能是一个简单的界面，可以将语音转换为文本。在本文的帮助下，使用来自Google的新的未记录语音API： / 我们能够在Ruby中提供一个非常简单的API，以将简单的音频解码为文本。 Google的API尚未公开，因此可能会更改。它似乎也非常脆弱，因为它多次返回500，因此该库具有内置的重试代码-对于较大的音频文件，可能会在检索成功结果之前返回10多个失败… 似乎API也只喜欢较小的音频文件，因此有一个内置的分块器，使我们可以将音频分成较小的块。安装将此行添加到您的应用程序的Gemfile中： gem 'speech2text' 然后执行： $ bundle 或将其自己安装为： $ gem install speech2text 您还必须在本地计算机上安装ffmpeg

2022-09-07 11:05:43 1.88MB Ruby

1

speech_recognition：适用于Python的语音识别模块，支持在线和离线的多个引擎和API

2022-05-15 21:31:48 119.55MB audio python speech-recognition speech-to-text

1

语音演示：语音api示例-源码

演讲演示项目地址： : 文档地址：语音识别： ://ai.baidu.com/docs#/ASR-API/top 语音合成： ://ai.baidu.com/docs#/TTS-API/top 百度语音rest api调用语音识别，语音合成示例 Rest API接口为http访问，任意操作系统，任意语言，只要能对baidu域名发起http请求的，均可以使用。百度语音合成的接口支持跨域，但是获取令牌的接口不支持。浏览器直接发请求的示例见： : 简介以JAVA PHP python C BASH作为示例，展示api的调用过程，选择一个运行即可。目录结构 +--rest-api

2022-03-09 20:04:55 3.02MB rest-api speech-recognition baidu speech-to-text

1

speech-to-text:混合语言语音识别系统；混合（GMM + NNet）模型；卡尔迪+凯拉斯-源码

混合语言语音识别来自团队：当中国学生在各州学习时，我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。因此，在此任务中，我们将开发此功能-使用深度学习架构（DNN，CNN，LSTM）构建模型，以将多语言音频（在同一句子中具有中英文）正确地翻译成文本。 - 表中的内容：目录说明代码开关：包含用于构建系统的脚本描述： LDC2015S04，我们的数据集描述笔记：我们关于Kaldi相关timit研究笔记，包括timit和librispeech 建立系统的资源数据源：基准模型文件：其他与代码转换有关的论文：功能改进相关论文：有趣的Python Kaldi包装器将被检查：卡尔迪推荐的食谱要检查：卡尔迪资源：卡尔迪（Kaldi）范例解码数据准备：文档名称：图案

2021-12-07 13:45:37 1.07GB 系统开源

1

wavenet-speech-to-text:基于DeepMind的WaveNet的PyTorch语音识别实现-源码

使用WaveNet进行语音转文字仍然需要弄清楚CTCLoss的南问题基于DeepMind论文：语音识别实现。此实现的目的是结构合理，可重用且易于理解。这里的流实现：尽管WaveNet被设计为“文本到语音”模型，但该论文提到他们也在语音识别任务中对其进行了测试。他们没有提供有关实现的具体细节，只是表明他们通过直接在TIMIT上对原始音频进行训练的模型在测试数据集上达到了18.8 PER。我从修改了WaveNet模型，并将的语音识别实验。下图显示了最终的体系结构。（图片来源：）先决条件系统 Linux CPU或（NVIDIA GPU + CUDA CuDNN） Python 3.6 图书馆 PyTorch = 0.4.0 librosa = 0.5.0 熊猫> = 0.19.2 == 0.11.0 数据集我们使用了，和语料库。由上

2021-11-18 20:12:04 216KB Python

1

c# 用SAPI实现语音识别及文本转换的详细教程

c# 用SAPI实现语音识别及文本转换的详细教程每一步都特别详细相信看完之后语音识别这快就没问题了翻译的可能有些问题

2019-12-21 19:34:37 873KB c# speech to text语音识别

1

个人信息

热门下载

最新下载

其他资源