矢量量化(VQ)技术
概述
基本原理
失真测度
矢量量化器的最佳码本设计
矢量量化技术的优化设计
动态时间规整(DTW)技术
一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。
语音学和声学的方法
该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。
神经网络的方法
基于ANN的语音识别系统通常由神经元、训练算法及网络结构等三大要素构成。由于基于神经网络的训练识别算法由于实现起来较复杂,目前仍只是处于实验室研究阶段。
模板匹配
作用是按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。
模板匹配的方法发展比较成熟,目前己达到了实用阶段。
常用的技术有三种:
矢量量化(VQ)技术
动态时间规整(DTW)
1