人工智能 ——语音识别技术 人工智能-语音识别技术全文共17页,当前为第1页。 什么是语音识别技术? 与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。 人工智能-语音识别技术全文共17页,当前为第2页。 两款语音机器人: Siri Cortana 人工智能-语音识别技术全文共17页,当前为第3页。 语音识别的实现(1) 首先,我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声音波形的一个个点了。下图是一个波形的示例。 人工智能-语音识别技术全文共17页,当前为第4页。 语音识别的实现(2) 在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续
2022-07-01 13:03:01 1.04MB 文档资料
该文件为语音识别课程博客对应的思维导图,建议使用知犀思维导图打开。
2022-07-01 09:10:02 75KB 语音识别 人工智能 思维导图
1
YS-LDV7语音识别模块原理图(20190215).doc
2022-07-01 09:07:54 115KB YS-LDV7语音识别模块原理图
语音识别V2.zip语音识别V2.zip
2022-07-01 09:07:53 53.16MB 语音识别V2.zip
企业微信注入发送语音。易语言发送企业微信语音流程! 电脑端发送企业微信,及个人微信语音。 可以监控新信息。按流程发送语音。 易语音编写,带源码。
1
语音模块提高抗干扰办法.pdf
2022-07-01 09:01:00 82KB 语音模块提高抗干扰办法.pdf
Delphi语音朗读程序,总共也就几个文件,供学习人事使用。 代码很简单。
2022-07-01 05:37:43 204KB Delphi 语音朗读
1
最好用的语音朗读程序-朗读女
2022-07-01 05:31:50 1.35MB 朗读女
1
Oculus Lipsync是一种Unity集成,用于将虚拟角色的唇部动作同步至语音。它主要是离线或实时分析音频输入,然后预测可用于令虚拟角色或非玩家角色(NPC)嘴唇动画化的一组发音嘴形。视觉音素/视素(visual phoneme/viseme)是嘴唇和面部的姿势或表达,其对应于特定的语音(音素)。例如在讨论读唇术时,我们常常使用这个术语,其概念类似于音素,并且是具备可理解度的基本视觉单元。在计算机动画中,我们可以使用视觉音素来制作虚拟角色的动作,令它们看起来像是在说话。
2022-06-30 20:06:10 107.13MB unity lipsync 口型同步
1
基于PaddlePaddle实现的语音合成工具,包含GUI界面操作和Web接口,以及简单示例。 视频教程:https://www.bilibili.com/video/BV1G34y1s744
2022-06-30 16:06:07 422.7MB 语音合成 paddlepaddle fastspeech2 tacotron2