AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。
2023-02-24 11:40:35 8.48MB 语音识别
1
语音识别】拨号语音识别含Matlab源码
2023-02-23 21:00:14 516KB
1
以一个能识别数字0~9的语音识别系统的实现过程为例,阐述了基于DTW算法的特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现的详细讨论,最后给出了在Matlab下的编程方法和实验结果。
2023-02-23 16:41:19 822KB 语音识别 端点检测 DTW算法 Matlab实现
1
WTN6系列语音芯片 程序 io 配置 语音芯片播报 需要 dealy.h dealy.c io.h io.c
2023-02-23 15:31:00 926KB STM32  F103
1
DUOKE多客免费开源圈子论坛社交系统,Tp6+uniapp框架,包含小程序、H5版、公众号版、PC落地页、安卓App、苹果APP,支持前后台创建圈子和发布帖子,圈子管理员,活动创建、关注粉丝等功能,方便二开。
2023-02-23 14:02:48 52.44MB uniapp 小程序 社交语音
1
基于神经网络的语音情感识别 MATLAB bpnn lvq pnn
2023-02-22 20:37:08 254KB 神经网络 语音情感识别 MATLAB
1
本文给出一种嵌入式以太网数字语音广播系统解决方案,能够较简单地实现广播系统的区域广播功能。该系统基于ARM架构,采用系统播放终端仲裁的方法控制区域广播的实现,广播内容能够同步播放和保存。   以太网数字语音广播系统主要是指以以太网为传播介质提供音频服务的广播系统,可以很好地利用以太网解决语音信号远距离传输难题。允许设计者创建大型网络结构来实现数以千路的数字语音信号在以太网上传输,充分利用了现有网络资源,避免重复架设线路的麻烦,实现了广播与计算机网络的多网合一,彻底解决了传统广播系统存在的音质不佳、容易受干扰、维护管理复杂以及互动性差等问题。同时可以实现选择全部、部分或特定区域进行定向分组广播
1
摘  要: 针对语音通信中不可避免要受到各种噪声的影响,致使通信质量下降的问题,采用DSP TMS320C5509和语音采集芯片TLV320AIC23搭建了语音降噪系统,实现了基于谱相减技术的实时系统来消除环境噪声。通过DSP开发板对信号进行采集与降噪实验,结果表明该系统具有较好的降噪效果,能有效地提高系统的信噪比。   在现实的语音通信中会不可避免地受到来自环境中的背景噪声影响,致使通信质量严重下降,甚至听不清楚对方讲话的内容,因此对带噪语音信号进行降噪已经成为语音通信中的一个非常迫切的课题。本文所介绍的语音降噪系统能够有效地实现数字降噪功能,由于降噪处理时不但要进行信号的采集与回放,还要进
2023-02-21 21:48:24 244KB 语音降噪系统设计和实现
1
《MATLAB语音信号分析与合成(第二版)》语音工具包 经常会调用的一些函数(自编函数或取自其他应用工具箱中的函数)已集中在basic_tbx工具箱中,在运行本书的程序前请把该工具箱设置(用set path设置)在工作路径下; 当要运行EMD处理时,要把emd工具箱设置在工作路径下; 当要运行主体延伸基音检测时,要把Pitch_ztlib工具箱设置在工作路径下; 当要进行时域基音同步叠加语音合成时,要把psola_lib工具箱设置在工作路径下; 当要应用本书提供的语音数据时,最好把speech_signal设置在工作路径下。
1
TTS实现文字转语音
2023-02-21 13:56:53 22KB TTS 文字转语音
1