近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高。高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model, GMM-HMM)是说话人识别研究领域中最重要的模型。由于该模型对大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈。为了解决该问题,研究者开始关注深度学习技术。引入了CNN深度学习模型研究连续语音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network, CSR-CNN)算法。模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量。实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果。
2021-04-21 20:40:30 1.29MB 连续语音 语谱图 GMM-HMM 深度学习
1
基于矢量量化(VQ)的说话人识别实验 训练过程: 从训练语音中提取特征矢量,得到特征矢量集合 通过LGB算法生成码本 重复训练进化 存储码本
2021-04-20 10:05:44 1.40MB matlab 语音识别
1
基于matlab的矢量量化(VQ)的说话人识别实验,有语音
2021-04-19 15:40:53 1.40MB matlab
1
声纹识别Android工程,包括性别识别、说话人识别。gmm-ubm、ivector算法。 详见https://blog.csdn.net/u012594175
2021-04-14 22:09:02 47.46MB 声纹识别 vpr 说话人识别
1
【一等奖 观察记录】中班 《我与幼儿共成长—不爱说话的萌萌》.docx
2021-04-14 16:04:19 18KB 幼儿园最新观察记录
【一等奖观察记录】大班 会说话的结构游戏室墙面.docx
2021-04-14 16:04:10 16KB 幼儿园最新观察记录
科大讯飞-InterVeri 2.1 产品白皮书 InterVeri(iFlytek Speaker Verifier)声纹识别系统是科大讯飞针对安全领域日益加剧的市场需求和增值领域应用而推出的专业声纹识别引擎。它通过对说话者语音和数据库中登记的声纹作比较,对用户进行身份校验和鉴别,从而确定该说话人是否为本人或是否为集群中的哪个人。声纹识别所提供的安全性可与其他生物识别技术(指纹、掌形和虹膜)相媲美,且只需电话或麦克风即可,无需特殊的设备,数据采集极为方便,造价低廉,是最为经济、可靠、简便和安全的身份识别方式。
1
该书是语音处理领域最权威的书籍。 包括内容:语音处理,权威,语音识别,说话人识别,说话人合成
1
电脑录音工具链接,内置与说话声音都可录,适用于面试,求职人群面试复盘知识点必备
2021-04-03 14:03:10 148B 面试必备 面试 录音工具
1
说话人识别,矢量量化(VQ),特征提取(MFCC),GUI界面,完整C源码,可运行。 说话人识别,矢量量化(VQ),特征提取(MFCC),GUI界面,完整C源码,可运行。
1