DeepSpeech剧本 使用DeepSpeech训练语音识别模型的速成班。 快速链接 从这里开始。 本部分将设定您对DeepSpeech手册可以实现的目标的期望,以及开始训练自己的语音识别模型所需的先决条件。 了解了DeepSpeech Playbook可以实现的功能后,本节将概述DeepSpeech本身,其组成部分以及它与您过去使用过的其他语音识别引擎的不同之处。 之前,你可以训练一个模型,你需要收集和格式化数据的语料库。 本节概述了DeepSpeech所需的数据格式,并逐步介绍了从Common Voice准备数据集的示例。 如果您正在训练使用与英语不同的字母(例如带有变音符号的语言)的模型,那么您将需要修改alphabet.txt文件。 了解得分手的工作,以及如何建立自己的得分手。 了解DeepSpeech的声学模型和语言模型之间的差异,以及它们如何组合以提供端到端语音识别。 本节
1
UnityWindows自带关键字语音识别演示项目,demo是 unity 2017.3.1f的
2021-11-12 21:55:50 5.08MB Uninty Speek
1
语音识别的MATLAB实现 论文 源码 用的是 DTW算法
2021-11-12 21:20:33 114KB 语音识别 MATLAB
1
WTK6900G-M01-P1是一款主要运用于灯具的模块,内置WTK6900G-24SS语音识别芯片,安静且无回声的环境中五米内识别率90%以上。可以通过语音指令来控制台灯的开关,调节灯的亮度以及色温的调节,并且可以通过触摸按键控制灯的开关、色温的调节以及无极调光。
1
语音识别的关键技术发展史,语音识别使用的关键技术介绍和基本原理解析。方便刚接触语音识别领域菜鸟学习。
2021-11-12 14:08:54 1.05MB 语音识别
1
基于 C5535 eZdsp的语音识别,直接移植到PC端的CCS中的项目里,能直接运行,实现语音的识别功能,需要耳麦配合使用,说话声音需要清晰
2021-11-11 09:14:05 16.26MB C5535 DSP 语音识别
1
多媒体技术_语音识别技术.pptx
2021-11-10 18:12:16 7.16MB 多媒体技术 语音识别技术
pocketsphinx库的组件,python中语音识别功能包pocketsphinx的中文识别模块。对普通话进行解析。资源:https://wwa.lanzous.com/ibiyeqd CSDN上面的资源,下的人多了所需积分就会暴涨,屑
2021-11-10 17:48:28 51.52MB 语音识别
1
image_and_speech_processing Face and speech recognition by use pyqt5 face_recognition baiduai 使用pyqt5 face_recognition 百度ai实现的 对图像和语音的处理 这是上一个版本的更新版 。 这是上一个版本 下面是部分效果图 界面是使用pyqt5 做的 教程稍后会在博客上发布 人脸识别是用face_recognition 这是一些使用方法 语音合成 语音识别是使用百度AI提供的api接口实现 教程稍后再博客上发布 主要思路 稍后再博客上发布
2021-11-10 09:50:20 13.99MB Python
1
一个基于Qt的简单的语音识别项目 首先,语音识别要做三件事情 1.记录用户的语音文件到本地 2.将用户语音编码 使用flac或者speex进行编码 3.使用第三方语音识别API或者SDK进行分析识别语音 目前做的比较简单就是使用flac文件对wav音频文件进行编码 基于Mac OSX和Win 7平台的 win 7下使用flac.exe,具体exe帮助,读者可以使用flac.exe --help > help.txt 重定向到一个help文件中,方便查阅. mac osx下面安装flac.dmg的安装包即可使用flac命令 我们先看音频的录入 Qt集成了音频模块
2021-11-10 09:37:11 28KB 源码 c++
1