包含了语音信号处理的基本知识 比较精炼 是我们老师上课用的课件
1
(完整版)基于51单片机的医院病房紧急呼叫系统(无线+语音).doc
2023-02-26 18:43:41 663KB (完整版)基于51单片机的医院病
1
中文离线语音包,用于文字转语音模型,采用vosk技术,找vosk调用方法就ok。 最近研究vosk 官网提供的gradle gradle没用过, osk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式。
2023-02-26 16:38:41 41.87MB 文字转语音 vosk
1
语音信号处理 第二章 语音信号处理的基础知识 §2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析 (1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。 (2) 语音中各个音的物理特性和分类的研究称为语音学(phonetics) 。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。 人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。
1
网络上找到的 一个好用的语音合成软件。输入汉字,即可转成语音。声音逼真,免费使用。
2023-02-25 20:52:39 12.75MB 好用语音合成
1
关键字 光立方 3D动态显示 RGB 语音控制 FPGA目 录设计概述第一部分 设计概述 /Design Introduction 4 1.1 设计目的 4 1
2023-02-25 20:12:59 10.53MB fpga开发 3d
1
从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFileClip(video_file) video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1']) 根据静音对音频分段 使用音频库 pydub,安装: pip install pydub 第一种方法: # 这里silence_thresh是认定小于-70dBFS以下的为silence,发现小于 s
2023-02-25 15:11:37 96KB 百度 语音识别
1
AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。
2023-02-24 11:40:35 8.48MB 语音识别
1
【语音识别】拨号语音识别含Matlab源码
2023-02-23 21:00:14 516KB
1
以一个能识别数字0~9的语音识别系统的实现过程为例,阐述了基于DTW算法的特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现的详细讨论,最后给出了在Matlab下的编程方法和实验结果。
2023-02-23 16:41:19 822KB 语音识别 端点检测 DTW算法 Matlab实现
1