摘要:系统以单片机和FPGA为控制,实现了语音存储与回放系统。该系统设计方案能够采集模拟语音信号以及耳机立体声信号,以ADPCM(自适应差分编码)的方式提高了存储器的利用率,语音存储时间可达2 min;基于短时傅里叶变换原理,实现了语音信号的频谱分析与实时显示。同时,利用立体声音频功放播放语音,每声道音量可调并具有静噪功能。此外,该方案还采用预加重、去加重、抗混叠滤波等措施,有效地提高了信噪比。语音回放质量良好,存储时间较长。   0 引言   由单片机与FPGA共同完成语音的录制与回放,可以拥有丰富的接口资源和运算能力,鉴于PCM 的存储冗余值过大和DPCM 的量化噪声问题,ADPCM
1
包含了语音信号处理的基本知识 比较精炼 是我们老师上课用的课件
1
(完整版)基于51单片机的医院病房紧急呼叫系统(无线+语音).doc
2023-02-26 18:43:41 663KB (完整版)基于51单片机的医院病
1
中文离线语音包,用于文字转语音模型,采用vosk技术,找vosk调用方法就ok。 最近研究vosk 官网提供的gradle gradle没用过, osk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式。
2023-02-26 16:38:41 41.87MB 文字转语音 vosk
1
语音信号处理 第二章 语音信号处理的基础知识 §2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析 (1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。 (2) 语音中各个音的物理特性和分类的研究称为语音学(phonetics) 。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。 人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。
1
网络上找到的 一个好用的语音合成软件。输入汉字,即可转成语音。声音逼真,免费使用。
2023-02-25 20:52:39 12.75MB 好用语音合成
1
关键字 光立方 3D动态显示 RGB 语音控制 FPGA目 录设计概述第一部分 设计概述 /Design Introduction 4 1.1 设计目的 4 1
2023-02-25 20:12:59 10.53MB fpga开发 3d
1
从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFileClip(video_file) video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1']) 根据静音对音频分段 使用音频库 pydub,安装: pip install pydub 第一种方法: # 这里silence_thresh是认定小于-70dBFS以下的为silence,发现小于 s
2023-02-25 15:11:37 96KB 百度 语音识别
1
AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。
2023-02-24 11:40:35 8.48MB 语音识别
1
【语音识别】拨号语音识别含Matlab源码
2023-02-23 21:00:14 516KB
1