该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议,音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。这提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,奖识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照Mpeg-4面部动画标准参数的3-d头部模型,实现面部动画的同步生成。主观Mos评测结果表明:本文所实现的实时语音驱动虚拟说话人在同步性和逼真度上的Mos评分分别达到了3.42和3.50。
1
C# 调用讯飞语音win32sdk实现语音合成、实时语音转写-附件资源
2021-04-23 19:34:26 106B
1
针对工业现场工作人员需要与后方进行实时通信的问题,本文基于美国国家仪器(National Instruments,简称NI)公司推出的LabVIEW软件平台,利用其面向测控领域推出的网络通信技术DataSocket技术实现两台通讯设备的实时语音通讯。针对通讯过程中数据流向是双向的问题,本文对传统C/S(client/server)模式进行改进,使客户端和服务器端都具有数据接收发送的功能,在实验室环境下,利用两台电脑实现了实时语音通信.
1
vc socket tcp实现语音聊天
2021-04-04 17:07:15 17KB 语音聊天 语聊
rtasr_java_demo_wss(实时语音转写demo).zip
2021-03-27 20:11:45 966KB 实时语音转写
1
通过对语音识别原理的系统分析,结合特定人语音识别的具体情况,研究了动态规整算法(DTW),应用凌阳SPCE061A单片机,实现了基于实时语音识别的门禁系统的总体设计。试验表明,在1.3 s内,系统误差率低于8%。该系统可应用于现代建筑的电子门锁类产品中,对实现智能化控制具有较强的实用价值。
2021-03-10 17:02:15 207KB 51单片机
1
讯飞语音,识别真的很准确。 讯飞语音转写,实时的贵,不实时的慢。。。 今天尝试了用讯飞听写通过流的方式实现实时转写。 主要思路是这样。首先确认pcm文件的保存路径。 然后创建一个线程不断读写pcm内的内容变化。 每次读取1024*1024字节调用 mIat.writeAudio(byte[] var1, int var2, int var3)方法,等待回调结果。 记录每次的回调结果,拼接字符串。 部分代码如下,下面代码是完整pcm文件的转写的代码。准确率和讯飞网页的识别率相差无几。 实现了之后发现。讯飞听写接口认证后才20000/天,没有认证500/天。可能讯飞也知道这个漏洞才加的限制吧
2021-03-02 17:01:56 37KB 讯飞语音 实时语音转写
1
格式为中国知网的标准文献阅读格式:用CAJView 软件就可以很方便的浏览了! 本文设计了一种适于对声码器输出码流进行前向纠错编码的半规则化低密度奇偶校验码(LD- PC码)。该低密度奇偶校验码具有编、译码简单,存储量少,易于硬件实现等特点。同时对汉明码、 卷积码、低密度奇偶校验码在AWGN信道下的传输性能进行了仿真比较。结果表明,长度适合的 LDPC码误码性能超过汉明码、卷积码。
2020-01-08 03:12:04 293KB 语音传输 LDPC码 纠错编码 文献
1
即构科技倾力打造的语音视频实时通信技术,核心团队源自腾讯QQ语音视频原班人马,曾经打造过QQ语音视频实时通话技术,支撑QQ亿级在线用户。本产品白皮书从应用场景、技术特点和开发者利益等角度来介绍即构的语音视频实时通信技术,希望对您带来价值。
2019-12-21 22:17:16 3.65MB 实时语音视频
1
使用QTsocket对讯飞开发平台上的实时语音webapi进行调用
2019-12-21 21:46:45 13.11MB QT 实时语音
1