对语音识别结果加上标点符号,使用教程:https://yeyupiaoling.blog.csdn.net/article/details/122474859
2022-01-14 09:20:10 346.92MB asr paddlepaddle 语音识别
1
深语音 使用实现DeepSpeech2用于PyTorch。 该支持使用模型进行训练/测试和推断。 可选地,可以在推理时使用语言模型。 安装 需要安装几个库才能进行工作培训。 我将假定一切都已在Ubuntu的Anaconda安装中安装,并安装了PyTorch。 如果尚未安装,请安装 。 如果要解码以使用可选语言模型支持波束搜索,请安装ctcdecode: git clone --recursive https://github.com/parlance/ctcdecode.git cd ctcdecode && pip install . 最后克隆此仓库并在仓库中运行它: pip install -r requirements.txt pip install -e . # Dev install 如果您打算使用多节点训练,则需要etcd。 以下是在Ubuntu上安装的命令。 su
2022-01-12 16:07:47 63KB Python
1
录音转文字,语音转文字,文字转语音,多国语言翻译。一款智能文字、语音互转的文字语音转换软件。录音转换文字_音频录音,精准识别,免费下载,适用教育培训,媒体传播等各种场景下的音频转文字需求!
1
懒人视频字幕提取神器支持语音识别文字识别外部播放器字幕提取等全覆盖打击!!!自媒体学生党搬砖神器! 懒人视频字幕提取工具支持全部视频格式和外部万能播放识别,这是一个可以把视频中的字幕识别并提取出来的软件,我们经常看一些视频、课程、新闻、因为已经融合到了视频当中我们无法复制,但是如果通过语音识别,有时候又会存在不太准确的问题,那么今天这个神器可以通过OCR文字识别技术还通过扑捉设定区域,自动把视频文字幕采集出来,显示中文字幕。
2022-01-12 09:02:41 59.65MB 视频OCR识别软件
MASR中文语音识别模型(大数据集训练的),源码地址:https://github.com/yeyupiaoling/MASR
2022-01-10 16:11:05 546.58MB 语音识别 pytorch asr masr
语音识别模块资料包括程序源代码、原理图和PCB图。 1、电路图用Altium Designer软件绘制; 2、程序代码用KEIL软件编写; 3、包括语音识别模块程序源代码; 4、包括语音识别模块原理图源文件; 5、包括语音识别模块PCB图源文件; 6、语音识别模块上单片机型号:STC11L08XE; 7、语音识别模块上语音识别芯片型号:LD3320A。 依据该语音识别模块资料做的语音识别模块本人亲测可用。
本Demo实现了百度语音在线识别
2022-01-09 11:33:06 57.63MB 百度语音识别
1
语音识别 * 由此引入多元检测问题
2022-01-08 09:55:56 1.42MB 课件
1
Kaggle语音识别 这是针对的Kaggle竞赛的项目,目的是为简单的语音命令构建语音检测器。 该模型是使用连接器时间分类(CTC)成本的卷积残差,向后LSTM网络,由TensorFlow编写。 首先将音频波文件转换为滤波器组频谱图。 CNN层从频谱图输入中提取分层特征,而LSTM层的作用类似于编码器/解码器,对CNN特征的序列进行编码,并输出字符作为输出。 LSTM编码器/解码器非常动态。 取决于训练词汇,可以用整个单词,音节或仅音素的信息对发出的字符进行编码。 完全连接的层会压缩表示形式,并进一步将字符与单词解耦。 该项目旨在调试和可视化友好。 提供这些界面以权重和激活,登录TensorBoard并记录示例单词的学习,这些示例单词显示了如何在训练中学习角色和决策边界。 安装和使用: 先决条件:Python 3.5,TensorFlow 1.4; 或Python 3.6,Tens
2022-01-06 13:45:16 1.93MB tensorflow kaggle lstm speech-recognition
1
中文语音识别项目程序
1