中文离线语音包,用于文字转语音模型,采用vosk技术,找vosk调用方法就ok。 最近研究vosk 官网提供的gradle gradle没用过, osk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式。
2023-02-26 16:38:41 41.87MB 文字转语音 vosk
1
语音信号处理 第二章 语音信号处理的基础知识 §2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析 (1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。 (2) 语音中各个音的物理特性和分类的研究称为语音学(phonetics) 。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。 人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。
1
网络上找到的 一个好用的语音合成软件。输入汉字,即可转成语音。声音逼真,免费使用。
2023-02-25 20:52:39 12.75MB 好用语音合成
1
关键字 光立方 3D动态显示 RGB 语音控制 FPGA目 录设计概述第一部分 设计概述 /Design Introduction 4 1.1 设计目的 4 1
2023-02-25 20:12:59 10.53MB fpga开发 3d
1
从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFileClip(video_file) video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1']) 根据静音对音频分段 使用音频库 pydub,安装: pip install pydub 第一种方法: # 这里silence_thresh是认定小于-70dBFS以下的为silence,发现小于 s
2023-02-25 15:11:37 96KB 百度 语音识别
1
AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。
2023-02-24 11:40:35 8.48MB 语音识别
1
【语音识别】拨号语音识别含Matlab源码
2023-02-23 21:00:14 516KB
1
以一个能识别数字0~9的语音识别系统的实现过程为例,阐述了基于DTW算法的特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现的详细讨论,最后给出了在Matlab下的编程方法和实验结果。
2023-02-23 16:41:19 822KB 语音识别 端点检测 DTW算法 Matlab实现
1
WTN6系列语音芯片 程序 io 配置 语音芯片播报 需要 dealy.h dealy.c io.h io.c
2023-02-23 15:31:00 926KB STM32  F103
1
DUOKE多客免费开源圈子论坛社交系统,Tp6+uniapp框架,包含小程序、H5版、公众号版、PC落地页、安卓App、苹果APP,支持前后台创建圈子和发布帖子,圈子管理员,活动创建、关注粉丝等功能,方便二开。
2023-02-23 14:02:48 52.44MB uniapp 小程序 社交语音
1