只为小站
首页
域名查询
文件下载
登录
Windows_aitalk.zip
讯飞离线命令词识别Window下Demo Qt封装使用,使用前若登录失败请检查APPID 相关问题。讯飞语音相关便捷参考资料请参考文件夹下:参考.txt
2022-05-23 17:50:42
42.8MB
讯飞语音命令词
讯飞语音
语音识别
讯飞离线命令词
1
语音识别
技术文章.rar
第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1 概述 3.2 语音信号的数字化和预处理 3.2.1 语音信号的数字化 3.2.2 语音信号的预处理 3.3 短时平均能量和短时平均幅度 3.3.1 短时平均能量 3.3.2 短时平均幅度 3.4 短时过零分析 3.4. 1 短时平均过零率 3.4.2 短时上升过零间隔 3.5 短时自相关函数和平均幅度差函数 3.5.1 短时自相关函数 3.5.2 短时平均幅度差函数 3. 6 高阶统计量 3.6.1 单个随机变量情况 3.6.2 多个随机变量及随机过程情况 3.6.3 高斯过程的高阶累积量 3.7 小结 参考文献 第4章 语音信号处理方法--时频处理 4. 1 概述 4.2 短时傅里叶变换 4.2.1 短时傅里叶变换的定义和物理意义 4.2.2 基于短时傅里叶变换的语谱图及其时频分辨率 4.2.3 短时傅里叶谱的采样 4. 3 小波变换 4.3.1 连续小波变换 4.3.2 二进小波变换 4.3.3 离散小波变换 4.3.4 多分辨分析 4.3.5 正交小波包 4.4 Wigner分布 4.4.1 Wigner分布的定义 4.4.2 Wigner分布的一般性质 4.4.3 两个信号和妁Wigner分布 4.4.4 Wigner分布的重建 4.4.5 Wigner分布的实现 4.5 小结 参考文献 第5章 语音信号处理方法--倒谱同态处理 5.1 概述 5.2 复倒谱和倒谱 5.2.1 定义 5.2.2 复倒谱的性质 5.3 语音信号的倒谱分析与同态解卷积 5.3.1 叠加原理和广义叠加原理 5.3.2 同态解卷特征系统和同态解卷反特征系统 5.3.3 同态解卷系统 5.3.4 语音的复倒谱及同态解卷 5.4 避免相位卷绕的算法 5.4.1 最小相位信号法 5.4.2 递归法 5.5 小结 参考文献 第二部分
语音识别
系统 第6章 语料库 6.1 概述 6.2 语料库的基本特征 6.3 语料库的类型 6.4 语音语料库 6.4.1 语音语料库建立、收集和标注的意义 6.4.2 语音语料库的建立和收集要点 6.4.3 标准语音库语音特性描述 6.5 语料库的设计举例--863汉语普通话语音合成语料库的设计 6.5.1 语料库设计原则 6.5.2 语音库的标注 6.5.3 与语音语料库相关的文字语料库标注 6.6 小结 参考文献 第7章
语音识别
的预处理 7.1 概述 7.2
语音识别
单元的选取 7.2.1 汉语音节 7.2.2 汉语的基本音素 7.2.3 汉语半音节 7.3 自动分段--端点检测技术 7.3.1 基于能量的端点检测 7.3.2 基于LPC-10声码器的端点检测 7.3. 3 基于信息熵的语音端点检测 7.3.4 基于频带方差的端点检测 7.3.5 基于倒谱特征的带噪语音信号端点检测 7.3.6 基于HMM的端点检测方法 7.3.7 基于分形技术的端点检测 7;3.8 基于自相关相似距离的端点检测 7.3.9 基于迟滞编码的端点检测 7.3.10 实时端点检测算法 7.4 小结 参考文献 第8章 语音信号特征参数 8.1 概述 8.2 基音周期 8.2.1 自相关法及其改进 8.2.2 并行处理法 8.2.3 倒谱法 8.2.4 简化逆滤波法 8.3 线性预测参数 8.3.1 线性预测信号模型 8.3.2 线性预测误差滤波 8.3.3 语音信号的线性预测分析 8.3.4 线性预测分析的解法 8.3.5 斜格法及其改进 8.4 线谱对(LSP)参数 8.4.1 线谱对分析原理 8.4.2 线谱对分析的求解 8.5 LPCC参数 8.6 MFCC参数 8.7 ASCC参数 8.8 感觉加权的线性预测(PLP)特征 8.8.1 PLP参数 8.8.2 RASTA-PLP参数 8.9 动态差分参数 8.10 高阶信号谱类特征 8.10.1 WV谱的定义及其主要性质 8.10.2 WV谱计算式的一些变形 8.11 小结 参考文献 第9章 特征变换 9.1 概述 9.2 线性判别分析(LDA) 9. 2.1 线性判别分析的概念 9.2.2 广义线性判别函数 9.2.3 Fisher线性判别 9.2.4 多类问题 9.3 主分量分析(PCA) 9.3.1 基于K-L变换的主分量分析 9.3. 2 随机向量的K-L展开 9.3. 3 基于K-L变换的降维 9. 4 独立分量分析(ICA) 9.4. 1 引言 9.4. 2 线性独立分量分析 9.4.3 线性独立分量分析算法 9.4.4 独立分量分析的预处理 9.4.5 非线性独立分量分析 9.5 小结 参考文献 第10章
语音识别
的模型 10.1 概述 10.2 动态时间规整(DTW) 10.2.1 动态规划技术(DP) 10. 2.2 DTW算法的改进 10.3 隐马尔可夫模型(HMM) 10.3.1 隐马尔可夫模型的定义 10.3. 2 HMM中的3个基本问题及其解决方案 10. 3.3 隐马尔可夫模型的类型 10.3.4 HMM算法实现的问题 10.4 分类模型(SVM) 10.4.1 引言 10.4.2 学习问题 10.4.3 学习过程一致性的条件 10.4. 4 学习过程收敛速度的界 10.4. 5 结构风险最小归纳原理 10.4.6 支持向量机 10.5 人工神经网络 10.5.1 引言 10.5.2 神经元的基本模型 10.5.3 前向网络 10.5.4 反馈网络 10.6 高斯混合模型(GMM) 10.6.1 高斯混合模型的定义 10.6.2 参数调整算法--EM算法 10.7 小结 参考文献 第三部分
语音识别
中关键处理技术 第11章 说话人自适应和说话人归一化技术 11.1 概述 11.2 自适应方式的分类 11.3 MLLR算法介绍 11.3.1 语音特征空间的划分 11.3.2 参数的估计 11.3.3 对均值矢量的变换 11. 4 MAP算法介绍 11.4.1 MAP算法准则 11.4.2 MAP算法公式推导 11.4.3 MAP算法讨论 11.5 说话人归一化技术 11.5.1 说话人归一化技术原理 11.5.2 声道长度归一化(VTLN) 11.6 小结 参考文献 第12章 噪声抑制 12.1 概述 12.2 基于小波变换的噪声抑制 12.2.1 利用小波变换去除周期性噪声 12.2.2 利用小波变换去除冲激噪声 12.2.3 利用小波变换去除宽带噪声 12.2.4 小波去噪方法的分析 12.3 基于EVRC编码的噪声抑制 12.4 基于HMM模型的噪声补偿 12.5 小结 参考文献 第13章 信道补偿 13.1 概述 13.2 稳健
语音识别
技术 13.2.1 稳健
语音识别
的提出 13.2.2 稳健
语音识别
的研究现状 13.3 信道补偿技术的主要方法 13.3.1 经验补偿技术 13.3.2 盲补偿 13.3.3 基于特征及模型的补偿 13.4 信道补偿技术在
语音识别
中的应用 13.4.1 信道补偿技术在汽车内
语音识别
中的应用 13.4.2 基于信道补偿的电话
语音识别
13.5 小结 参考文献 第四部分
语音识别
应用 第14章 说话人识别 14.1 概述 14.2 说话人识别的基本原理 14.2.1 说话人识别系统的典型结构 14.2.2 技术原理 14.3 说话人识别的特征选择 14.3.1 说话人识别系统中常用的特征 14.3.2 特征参数的统计评价 14.4 说话人识别的主要方法 14.4.1 模板匹配法 14.4.2 概率统计方法 14.4.3 辨别分类器方法 14.4.4.混合方法 14.5 判决规则与性能评价标准 14.5.1 说话人辨认 14.5.2 说话人确认(检测) 14.6 说话人识别中的稳健技术 14.7 系统举例 14.7.1 GMM说话人辨认算法 14.7.2 SVM-GMM混合模型 14.7.3 CMM-UBM说话人确认 14.8 小结 参考文献 第15章 关键词识别 15.1 概述 15.2 关键词识别及其与连续
语音识别
的关系 15.3 关键词识别原理 15.3.1 关键词识别系统组成 15.3.2 关键词识别的基本问题 15.3.3 关键词识别系统的主要技术难点 15.4 搜索策略 15.4.1 语音起始和结束点的粗判 15.4.2 帧同步的Viterbi解码算法 15.4.3 加入驻留惩罚的改进Viterbi解码算法 15.4.4 语法节点处的路径合并 15.4.5 回溯 15.5 识别结果的确认 15.5.1 置信度的原理 15.5.2 利用反词模型的拒识方法 15.5.3 利用识别结果本身信息的拒识方法 15.6 系统实现 15.6.1 训练和识别系统框图 15.6.2 训练系统的具体实现 15.6.3 识别系统的具体实现 15.7 小结 参考文献 第16章 语言辨识 16.1 概述 16.1.1 语言辨识的原理 16.1.2 语言辨识技术研究发展的历史 16.2 语言辨识所需要的有用信息 16.3 针对自动语言辨识的知觉研究 16.4 语言辨识的主要方法 16.4.1 频谱相似性方法 16.4.2 基于韵律信息的方法 16.4.3 基于音素识别的方法 16.4.4 基于多语言语音单元的方法 16.4.5 单词层次方法 16.4.6 基于连续
语音识别
的方法 16.4.7 元音系统模型 16.5 语言辨识系统举例 16.5.1 基于GMM-UBM模型的语言辨识系统 16. 5.2 基于最小分类误差准则的语言辨识系统 16.5.3 基于说话人聚类和高斯混合模型的语言辨识系统 16.5.4 基于时频主分量分析和高斯混合模型的语言辨识系统 16.5.5 基于高斯混合二元模型的语言辨识系统 16.6 语言辨识系统评估 16.7 小结 参考文献 第17章 连续
语音识别
17.1 概述 17.2 连续
语音识别
整体模型 17.3 声学模型 17.3.1
语音识别
单元的选取 17.3.2 基于予词单元HMM的训练 17.4 连续
语音识别
中的搜索策略 17.4.1 传统的帧同步算法 17.4.2 基于统计知识的帧同步搜索算法原理 17.4.3 受词法约束的词搜索树 17.4.4 连续
语音识别
中的双层搜索网络 17.5 语言模型 17.5.1 基于规则的方法 17.5.2 基于统计的方法 17.5.3 N-gram模型的平滑 17.5.4 基于文法规则的方法和基于统计的方法相结合 17.6 小结 参考文献 附录 英汉名词对照
2022-05-22 19:45:59
5.51MB
语音识别
MFCC系数
语音信号处理
过零率
1
labview智能语言识别,控制输出
labview智能语言识别,控制输出,可以输出控制信号,用于其他的拓展功能。
2022-05-21 15:01:36
55KB
labview
语音识别
1
java
语音识别
设计文档
java
语音识别
设计文档
2022-05-21 02:06:15
350KB
java
语音识别设计
1
语音识别
,
语音识别
转文字,matlab
实现
语音识别
波形,通过录一段语音,用matlab识别波形并对语音信号进行处理
2022-05-20 16:55:46
9KB
MATLAB语音
波形识别
语音识别
语音识别
语音识别
视频.txt
李琳山老师的
语音识别
课程,特别适合
语音识别
入门。 该视频包括了所有跟
语音识别
相关的技术、算法,HMM、GMM、声学模型、语言模型、wfst等等到包括在内。
2022-05-20 08:58:57
75B
语音识别
李琳山老师
1
深度学习-
语音识别
实战
基于深度学习的
语音识别
实战课程主要包括三部分内容:1.经典论文算法讲解;2.算法源码解读;3.项目实战;通俗讲解
语音识别
领域当下经典论文思想,详细解读源码中每一核心模块并基于真实数据集展开项目实战。整体课程覆盖
语音识别
领域四大核心主题:
语音识别
,语音分离,语音转换,语音合成;每一主题均按照论文思想解读,源码分析,项目实战顺序进行讲解。提供课程所需全部数据集,代码,PPT课件。
2022-05-19 17:46:15
342B
深度学习
语音识别
人工智能
语音合成
源码
算法
数据
1
基于DSP的
语音识别
系统设计 (2012年)
为了提高
语音识别
系统的可靠性和高效率性,利用线性预测倒谱(LPCC)和动态时间规整技术(DTW)设计了一种
语音识别
系统。系统以TI公司的TMS320VC5402DSP芯片为控制核心,以汉语言的短命令为识别对象,实现特定孤立词语言识别功能。系统设计了串行通讯接口,更好地利用计算机对其控制。同时系统能进行语音指令的识别并做出相应的应答。该系统适合应用在一些智能控制领域,且结构简单,功能稳定。
2022-05-19 17:19:37
1.03MB
自然科学
论文
1
智能语音播报系统电路设计
射频识别作为一种非接触式的自动识别新技术,近年来得到了迅速的发展并逐步走向成熟。其原理是基于无线射频信号的传输特性,进行非接触式自动识别,从而自动识别被标识对象,获取对应数据进行交换。最常见的识别方法是一个串行存储号码识别一个人或物体。在此介绍一种基于 RFID和单片机技术的智能语音播报系统,可广泛应用于旅游景点自助导游、博物馆自助讲解、公交车站自动报站等场合。
2022-05-17 01:19:10
69KB
智能硬件
语音识别
RFID
AT89S52单片机
1
人工智能应用基础:
语音识别
.pptx
自然语言理解
语音识别
《人工智能应用基础》项目概述《人工智能应用基础》(1)任务描述 通过本任务的学习,掌握如何通过给定的语音,检测语音中文字信息。(2)任务目的 ① 了解语音中的特征提取方法。 ② 掌握利用给定的音频,检测语音中文字的方法和流程。(3)任务要求 ① 利用给定音频文件,完成音频中文本识别的Python实现。(4)任务实施 结合百度智能云接口所需要的API key, Secret key,实现
语音识别
。 任务准备:事先完成aip等第三方库的安装。实现《人工智能应用基础》##导入百度
语音识别
库from aip import AipSpeech#申请百度
语音识别
,获取百度用户的ID、key和访问的密钥。APP_ID = '22817935'API_KEY = 'yh7RUGQm9RVxuZSbSGQI9wSE'SECRET_KEY = 'SHdxFzn9GdhlcMmQGHuCTKVYHib6311E'##发起请求client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取音频文件def get_file_content(filePat
2022-05-16 21:05:34
4.51MB
人工智能
语音识别
文档资料
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2019综合测评仿真.zip
狂神说Java系列笔记.rar
simulink仿真实现光伏发电MPPT+能量管理
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
JPEG的Matlab实现
粒子群算法优化3-5-3多项式工业机器人时间最优轨迹规划算法matlab代码
云视通扫描工具.zip
C4.5决策树算法的Python代码和数据样本
Elsevier爱思唯尔的word模板.zip
DBSCAN算法Matlab实现
商用密码应用与安全性评估——霍炜.pdf
Spring相关的外文文献和翻译(毕设论文必备)
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
token登录器.rar
基于STM32的FFT频谱分析+波形识别
最新下载
小波阈值MATLAB代码,可以实现软阈值、硬阈值以及5种改进阈值方法,封装好的函数快速实现
2022年电赛A题:单相交流电子负载 单相pwm整流 基于stm32f407vet6的单相DQ锁相环
9218-9217B增加强刷.救砖模式增量单刷脚本(内有说明).7z
ckeditor_4.14.1_full
掌讯方案9218、9217B、9217升级说明及工具(电脑升级不要勾选Preloader).rar
KT and KP(xTouch_2015-05-15.36515.rtm).zip
owncloud 8.0.16
散度、旋度、梯度释义(图解版)—(美)H.M.斯彻 著 李维伟等译 2015.11出版
FME2015破解版+汉化包
CESP一级集训课PPT第三课
其他资源
IMX290技术及应用文档
MySQL-Front-v6.1.zip
word转pdf用到的jar包
powerword 新英格兰39节点系统
MicrosoftProgram_Install_and_Uninstall.meta.diagcab
将卷积运算转换成矩阵相乘
基于springBoot、mybatis、jsoup、bootstrap、freemarker、mysql等搭建的电影网站
基于socket文件传输的实现源码[C++]
安卓图片上传服务端+客户端
2048点FFT 在FPGA下实现的Verilog程序
K-means CUDA实现
32位浮点数转换成十进制小数程序
基于EEPROM可编程彩灯控制器
ros5.25 225MB img破解版本
template.rar
使用swoole实现http,已经封装写好成对象方式
jdk-8u181-windows-i586.exe
系统架构师真题及答案.zip
SSDT钩子 隐藏进程_SSDT HOOK没用汇编代码修改CR0的第16位,修改SSDT进程列表及进程的时间属性值.zip
.net汽车销售管理系统源码.zip
jar反编译工具.zip
基于Labview的信号发生器的设计
C3D2016本地化包