字节跳动人工智能实验室语音团队-基于GPU的大规模音频理解和合成解决方案,包括:音频合成关键技术、音频理解重点应用场景、音频合成技术展示、训练平台、推理框架等等内容
2022-01-23 12:26:34 12.09MB 智能语音 语音合成 语音识别
1
voicebox语音信号处理工具箱 工具箱内容 音频文件输入/输出 读写WAV和其他语音文件格式 频率标度 在Hz,Mel,Erb和MIDI频率刻度之间转换 傅立叶/ DCT / Hartley变换 各种相关的变换 随机数和概率分布 生成随机向量和噪声信号 矢量距离 计算矢量列表之间的距离 言语分析 有源电平估计,频谱图 LPC语音分析 线性预测编码例程 语音合成 文本到语音合成和声门波形模型 语音增强 光谱噪声减法 语音编码 PCM编码,矢量量化 语音识别 用于识别的前端处理 信号处理 其他信号处理功能 信息论 熵计算和符号代码的例程 计算机视觉 3D旋转的例程 打印和显示功能 用于打印和图形的实用程序 语音箱参数和系统接口 获取或设置VOICEBOX和WINDOWS系统参数 效用函数 其他实用功能 音频文件输入/输出
1
语音合成相关模型,使用地址:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/tree/master/tools/generate_audio 和 https://github.com/yeyupiaoling/PPasr/tree/master/tools/generate_audio
2021-10-25 16:09:17 392.32MB tts asr 语音合成 语音识别
1
移动终端开发实践结题作业,包含报告,整个程序,可以直接在Android Studio中运行,包含语音识别,语音合成。
2021-07-09 09:09:56 285.55MB 安卓开发 语音
1
本资源是润尼尔公司内部资源,仅供大家学习参考。 1、项目中有详细的使用文档 2、支持PC,WebGL语音合成、语音识别、录音功能 3、资源已更新到最新版本1.0.4 4、运行环境Unity2018.3 创作不易,欢迎大家关注博主: https://blog.csdn.net/qq_43123093/article/details/104817384
2021-06-14 22:59:53 10.1MB 语音合成 语音识别 录音播放 讯飞语音
1
从拼音到音素的字典 如 : wo1 -----> w , o1, 中文语言合成等相关任务可以使用, 一共3个大字典, 提供3种切分中文音素的方法。
1
PC端的,用的是讯飞的SDK和百度的SDK。至于为什么用两个SDK,我也不想啊,C++我也不会啊。这里吐槽一下,讯飞的技术文档真的写给自己看的。 讯飞:语音识别、语音合成(Windows MSC) 百度:人机交互(UNIT)
2021-03-15 15:18:44 12.34MB unity AI 语音合成 语音识别
1
智能语音识别,语音合成,在原版基础上更改了部分参数,使得响应时间更短,开放了主要参数,在检视面板中可以直接调整 ,正直观方便
2021-01-28 05:04:39 55KB 语音合成、语音识别
1