语音识别(Automatic Speech Recognition)是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语。语音识别技术就是让机器通过..
2021-11-17 17:26:09 367KB 语音识别
1
将文本复制粘贴在matlab的命令窗口即可运行,大家可以共同学习。
2021-11-17 11:01:38 4KB 语音识别 短时频谱代码
1
opensmile2.1.0版本,可用于语音特征提取。输入.wav文件的路径,调用opensmile即可输出.txt文件
2021-11-16 16:08:13 59.07MB 语音识别
1
语音识别通过CNN 孤立词语音识别,复旦大学计算机科学技术学院数字信号处理期末项目 介绍 此仓库实现了一个强大的语音识别系统,该系统可以识别20个单独的单词,例如“语音”,“北京”,“文件”等。它利用从原始语音中提取的梅尔频谱特征,将频谱视为图片,卷积神经网络被用来对它们进行分类。 详细中文介绍请参考课程报告。 怎么玩 您需要一个支持CUDA(因为推理过程需要GPU)和flask的pytorch(版本> = 0.4)的python环境。 强烈建议使用Anaconda设置了环境,了解更多详情,请参考[]和[ ](适用于中国大陆用户的方便,请参见[])。 设置环境后,您可以通过键入以下内容轻松启动识别服务 python audio_server.py 进入您的命令行。 该命令将在端口22339上启动Web服务,因此您可以通过localhost:22339访问它 通过单击按钮,您的声音将被
2021-11-16 15:13:15 144.01MB JupyterNotebook
1
主要为大家详细介绍了语音识别之梅尔频率倒谱系数及Python实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2021-11-15 22:39:05 96KB python 梅尔频率倒谱系数 语音识别
1
语音识别算法matlab 源代码!完整!可运行!
2021-11-15 20:03:18 2.06MB 语音识别算法
重要事项 目前本文中提到的API已支持微信小程序录音文件格式:silk v3、mp3。 注:微信小程序开发工具上的录音不论是新接口还是老接口,都是webm/base64格式,虽然后辍名是silk(或mp3),但不是真正的silk v3(或mp3)格式的,打开看头部是 [removed] 开头的。 为了便于调试,2017年9月份时我补逻辑给支持上了,但是:我在2017年11月份发现原有的webm/base格式又不支持了。 api服务器端代码没有动过,跟踪查过,目前仅发现在2017年10月份之前用微信小程序开发工具录的文件,还是可以支持的,在10月份之后的文件,就不支持
2021-11-15 19:13:46 511KB 微信 程序 语音 识别 服务 搭建 全过程
1
人工智能学科自从诞生之后,技术理论不断发展,应用领域不断延伸。应用领域主要包括智能机器人、图像处理、自然语言处理及语音识别等。人工智能的基础理论科学包括计算机科学、逻辑学、生物学、心理学及哲学等众多学科。从人工智能的发展历史、人工智能的技术核心以及人工智能的应用前景3方面讨论人工智能的发展与应用,希望为相关研究提供有益的指导和借鉴。
1
1、概述通过微信小程序wx.startRecord()和wx.stopRecord()接口录音并上传silk录音文件至服务器,通过ffmpeg将silk录音文件转成wav录音文件,再通过百度语音识别 REST API 获取语音识 ...       1、概述 通过微信小程序wx.startRecord()和wx.stopRecord()接口录音并上传silk录音文件至服务器,通过ffmpeg将silk录音文件转成wav录音文件,再通过百度语音识别 REST API 获取语音识别后的结果。 2、代码实现 录音和语音文件上传 //index.js //开始录音。当主动调用wx.stopRe
2021-11-15 10:21:57 440KB 微信 程序 语音 识别 附小 服务器 源码
1
使用labview编写的语音识别程序,能够实现特定人声的识别。labview2012以上版本打开。
2021-11-13 22:10:39 1.21MB 语音识别
1