基于MATLAB的HMM语音信号识别,可以识别0-9十个阿拉伯数字,带有一个丰富的人机交互GUI界面。算法流程为:显示原始波形图……显示语音结束处放大波形图……显示短时能量……设置门限……开始端点检测……,也可以通过添加噪声,对比加噪后的识别准确率。
1
最近在处理语音检索相关的事。 其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python) 环境: python3.5 centos 7 流程 整个百度语音识别rest api 使用分为三部分: 1 (申请操作)创建应用,获取应用的 API Key 以及 Secret Key。 2 (程序实现)通过已知的 应用的 API Key 以及 Secret Key, 发送post 请求到 https://openapi.baidu.com/oauth/2.0/token 获取 token 3 (程序实现) 通过上步骤获取的 toke
2023-03-17 10:06:58 79KB api python token
1
vue使用js-audio-recorder实现一句话识别功能:以vue前端框架+腾讯云语音识别为基础,实现客户端长按录音,获取语音转换编译出来的识别码,传给后端去腾讯云语音识别库去换取识别回来的文本尽心客户端的文本查询!实现一句话查询效果!以vue前端框架+腾讯云语音识别为基础,实现客户端长按录音,获取语音转换编译出来的识别码,传给后端去腾讯云语音识别库去换取识别回来的文本尽心客户端的文本查询!实现一句话查询效果!以vue前端框架+腾讯云语音识别为基础,实现客户端长按录音,获取语音转换编译出来的识别码,传给后端去腾讯云语音识别库去换取识别回来的文本尽心客户端的文本查询!实现一句话查询效果!以vue前端框架+腾讯云语音识别为基础,实现客户端长按录音,获取语音转换编译出来的识别码,传给后端去腾讯云语音识别库去换取识别回来的文本尽心客户端的文本查询!实现一句话查询效果!以vue前端框架+腾讯云语音识别为基础,实现客户端长按录音,获取语音转换编译出来的识别码,传给后端去腾讯云语音识别库去换取识别回来的文本尽心客户端的文本查询!实现一句话查询效果!以vue前端框架+腾讯云语音识别为基础,实现客
2023-03-15 09:23:59 963KB vue 语音识别 js-audio-recorde
1
16bit 16k采样。自己java 写过websocket测试过,调用百度的语音接口,是可以使用的。
2023-03-08 10:47:28 77KB pcm  语音识别
1
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。 本项目现已训练一个迷你的语音识别系统,将项目下载到本地上,下载 thchs 数据集并解压至 data,运行 test.py,不出意外能够进行识别,结果如下: the 0 th example. 文本结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xian1 huo2 xiu4 mei4 shi1 yi4 ang4 ran2 原文结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xi
2023-03-02 18:14:02 108.36MB 语音识别 深度学习 语音 识别
1
语音识别 使用Web Speech API的语音识别 Web Speech API的SpeechRecognition接口是识别服务的控制器接口; 这也处理从识别服务发送的SpeechRecognitionEvent。 您可以在这里查看项目
2023-03-02 16:59:03 3KB JavaScript
1
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 JavaScript API, 可通过 Web Workers 录制 支持 PocketSphinx 所支持的所有声音模型 支持大多数 PocketSphinx 的命令行参数 支持 JavaScript 有限状态语法 FSG 输入 支持在编译时的来自文件的统计语言模型 支持键盘监测 可用于实时识别的可选音频录制库
2023-03-02 10:54:21 4.68MB pocketsphinx.js
1
深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar
2023-03-01 16:30:51 19.68MB 深度学习
1
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况. 依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3 个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.
2023-02-27 23:52:20 784KB 自然科学 论文
1
语音信号处理 第二章 语音信号处理的基础知识 §2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析 (1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。 (2) 语音中各个音的物理特性和分类的研究称为语音学(phonetics) 。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。 人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。
1