针对汉语的发音习惯以及语音可视化技术中对口型动画自然、连续的要求,提出了一种基于肌肉模型与协同发音模型的与语音保持同步的口型动画的方法。首先,根据汉语发音时的口型视位特征将声、韵母音素归类,并用数据映射的方式合成与之对应的口型关键帧。通过分析输入的文本信息,合成与语音保持同步的三维人脸口型动画。为了解决汉语发音习惯的问题,设计了一种基于微分几何学描述的协同发音建模的方法,该方法通过分析相邻音子间视素的影响权重,可以产生符合汉语发音习惯的口型动画。最后,通过实验对比和分析,该方法产生的口型动画更为逼真,且符合汉语发音的习惯。
1
发音数据库在语音产生和自动语音识别中的应用已经实践了很多年。 该研究的目的是建立一个指定中文普通话制作的发音数据库,并研究其在语音动画中的功效。 Carstens EMA AG501设备分别用于捕获声学数据和发音数据。 此外,还使用Microsoft Kinect相机来捕获面部跟踪数据作为补充。 最后,我们尝试了几种方法来提取声学参数,并建立了一个3D对话头模型来验证数据库的有效性。
2021-02-24 18:04:56 383KB Acoustic parameters; Articulatory database;
1