矢量量化(VQ)技术 概述 基本原理 失真测度 矢量量化器的最佳码本设计 矢量量化技术的优化设计 动态时间规整(DTW)技术 一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。 语音学和声学的方法 该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。 神经网络的方法 基于ANN的语音识别系统通常由神经元、训练算法及网络结构等三大要素构成。由于基于神经网络的训练识别算法由于实现起来较复杂,目前仍只是处于实验室研究阶段。 模板匹配 作用是按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。 模板匹配的方法发展比较成熟,目前己达到了实用阶段。 常用的技术有三种: 矢量量化(VQ)技术 动态时间规整(DTW)
2022-04-06 14:08:13 1.21MB 矢量量化 VQ VectorQuantizat 语音识别
1
按照书上语音压缩的LBG矢量量化基本算法实现的C代码,希望对初学者有帮助,不过里面没有空胞腔的处理,希望大家补充!!
2022-03-27 09:49:33 3.92MB LBG 矢量量化 VQ
1
该函数用于训练用于矢量量化的码本。 首先将数据集拆分为两个集群,然后找到每个集群的均值(质心)。 找到每个向量与这些质心的距离,并且每个向量都与一个集群相关联。 每个簇的向量均值首先替换质心。 如果总距离没有显着提高,则质心每个都分裂为两个。 这种情况一直持续到达到所需的集群数量并且改进不大。
2021-12-31 05:23:23 4KB matlab
1
信息论编码的课程作业。对初学者有一定帮助。理解矢量量化以及认识图像处理基本问题
2021-12-15 16:56:25 3KB 图像矢量量化
1
VQ_LBG矢量量化技术(分裂法),代码完整,不调库,内含数据集,直接能用,并能够保存为gif动态图。
2021-12-13 14:07:32 253KB VQ_LBG matlab
1
使用VQ适量量化对说话人进行识别,并成功应用到门禁识别领域,该程序使用matlab GUI界面开发,根据人声实现说话人的确认,然后对门禁系统进行开锁,目前可以实现添加说话人、删除说话人等一系列操作。与我的博客(基于VQ矢量量化的说话人识别(应用于门禁识别)是配套的)希望可以帮助到大家。
2021-12-04 13:00:24 42.74MB 说话人识别 门禁识别 VQ矢量量化
1
该程序从 4 个随机点开始演示矢量量化。 1. 选择前 4 个随机点作为聚类均值。 2. 然后我们找到最接近给定点的聚类均值并将其分配给相应的聚类。 在这里,我们可以设置信任区域的限制(基于欧几里德距离)。 比方说,距离聚类平均值小于欧氏距离 2 的点属于该特定聚类。 3. 分配完成后,我们继续计算下一组聚类均值。 4. 这之后又是另一轮分配。 我们可以看到集群和集群的含义如何随着迭代而变化。 5. 我将迭代次数设置为 15。这只是为了说明一旦确定了最佳聚类中心,分配将如何冻结。
2021-11-16 21:55:46 2KB matlab
1
改进kmeans算法matlab代码 通过K均值聚类对矢量进行量化: 整个代码库,图像和说明可在此存储库中找到。 加载图像: 1.1在本项目中,我们使用了NCSU工程大楼校园的图像,如下所示: 该图像已加载以下MATLAB代码(未读取): %1。加载图像(EB的视图):I = imread('ncsu.jpg'); 图(1),imshow(I); title('原始输入RGB图像'); 1.2然后,使用下面的MATLAB代码(rgb2gray)将输入的RGB图像转换为灰度图像: 从RGB转换为灰度图像:rgbI = rgb2gray(I); Figure(2),imshow(rgbI); title('灰色图像'); 1.3现在,为了简化数学,我们将图像调整为适当的尺寸,其中我们选择min {M,N}为2的幂,并且max {M,N}为2的幂的倍数。 在我们的例子中,我们取M = 512和N = 2X512。 我们正在使用以下MATLAB代码调整rgb图像的大小: %处理图像以获取正确的尺寸%获取灰色图像的尺寸:[M,N] = size(rgbI); %将图像重塑为尺寸M = 512,N
2021-09-26 00:54:43 4.35MB 系统开源
1
行业分类-电信-使用矢量量化技术对图象信号进行编码的装置.rar