综合阐述了语音识别技术的提出与发展历史,语音识别系统的分类,目前所面临的困难和采用的主要技术,以及 发展方向和应用前景
2021-06-06 19:55:09 255KB 语音识别 研究 发展
1
数字化胶片字符识别系统智能化的重点技术是数字图像处理技术,一方面改善成像胶片图像的质量,凸显出胶片中的字符信息便于字符定位与分割处理;另一方面,高质量,高清晰度的数字化字符胶片,可以构建正确率更高的字符数据库,便于最终的胶片字符识别,有效地提高了字符识别的正确率。数字化胶片字符识别系统智能化的关键技术是BP神经网络的搭建,一个高效的神经网络决定了能否正确识别输入的胶片字符信息,然而,正确的特征提取与准确的字符定位是确保神经网络识别的前提条件,所以,数字化胶片字符识别系统需要各模块均需要选择精确高效的实现算法。 胶片字符识别系统的原理:首先,使用MATLAB将采集到的图像信息读入,在X射线胶片识别系统中,其识别胶片图像中存在大量的随机噪声,图像分辨率低等不利于识别的因素,所以采用一系列的方法对图像信息进行预处理,如:图像降噪,图像增强,数字形态学处理等一系列操作。对于处理好的图像,分析不同像素点分布与边缘的相应变化范围,这样就可以确定字符的大致位置,由此分割出胶片的矩形区域;使用二进制编码方法对矩形区域进行处理后,使用相应的阈值将其分割成一个字符,将提取的训练样本的特征向量分配给BP神经网络进行训练,对待识别的样本放入已经训练好的BP神经网络中进行识别。由于输入的是RGB图像,其含有大量的颜色信息,这些颜色信息占用计算机的大量的存储空间,处理速度会变慢,为了计算机可以更快更高效地处理数据,所以颜色信息图像必须先执行预处理,转化为灰度图像,同时还需要执行一系列操作,如边缘检测,形态学处理,闭合,侵蚀,开放和关闭等,然后定位与识别胶片字符,最后在MATLAB2014a环境下设计GUI界面。 本章通过叙述胶片字符识别的研究背景与意义,并了解到国内外无损检测中的射线检测与字符识别的研究现状与一些先进技术与算法,并运用不同算法与方案设计字符识别系统,在此基础上,选择了BP神经网络进行对胶片字符识别系统设计,该系统可以在交通、医学、化工等更多领域得以推广运用。本论文的研究内容主要包括: (1)通过收集大量不同类型的存在字符信息的胶片图像,为BP神经网络训练与测试过程积累大量的原始数据; (2)确立胶片字符识别系统的整体架构和研究思路; (3)对收集到的胶片图像进行图像预处理操作,如灰度化、图像增强; (4)从预处理后的图片中分割出字符,建立数据集; (5)搭建BP神经网络,进行反复训练自学习与测试,再识别单个胶片字符; (6)设计GUI界面并显示结果。
2021-06-03 19:00:42 3.26MB BP
1
当前电子鼻对有毒气体的识别存在数据量少,训练生成的神经网络映射能力差等问题。本文以甲醛和甲醇为目标气体,采用自制的气敏传感器对甲醛和甲醇进行数据采集,并对采集到的数据进行滤波和平滑处理,以提取不同传感器对目标气体的响应值。依据准则函数生成伪随机数,并建立伪随机特征值矩阵以扩大有效数据量。利用主成分分析 (PCA)法对特征值进行降维处理,选择贡献率大的主元成分作为反向传播(BP)神经网络的输入向量,构造PCA-BP神经网络。分别用实测特征值矩阵和伪随机特征值矩阵训练PCA-BP神经网络,通过对比分析两个网络得出,实测特征值矩阵的识别率为92%,而伪随机特征值矩阵的识别率为97%。结果表明,伪随机特征值矩阵能有效提高PCA-BP神经网络的映射能力,提高识别正确率。
2021-06-02 15:15:22 5.41MB 测量 模式识别 伪随机特 反向传播
1
http://simulations.narod.ru/ 有关所用方法的解释,请参见 research.docx。 任务是找到可以从钢琴麦克风中获取声音的算法,并且算法必须识别它并将其打印在文本框中。 达到的结果: 1 条注释:93% 的正确答案2个笔记同时:61%的正确答案3个笔记同时:31%的正确答案4个笔记同时:13%的正确答案 里面有88个wav文件,里面记录了钢琴音符的声音。 这是动画频谱视频: http://www.youtube.com/watch?v=5xjD6SRY8Pg
2021-06-01 16:03:04 1.81MB matlab
1
摘要:BP神经网络具有较强的容错性和自适应学习能力,因而在数字图像识别领城有若广泛的应用。本丈在经典BP神 经网络的基本算法的基础上,对BP算法的参数设1进行了优化,实现了一种基于分类的改进BP神经网络算法。通过探 讨BP神经网络在数字图像分类识别中的应用,详细考察了各种参数对识别效果的影响。实脸结果证明改进后的算法有很好的实用价值。
2021-05-30 17:53:50 265KB 神经网络;图像识别
1
深度细粒度图像识别研究综述.pdf
2021-05-29 20:56:26 4.58MB 深度细粒度图像识别研究综述.
1
随着医疗信息化的发展,医院产生了大量的医疗数据信息,积累了庞大的医疗电子病历数据。电子病历(EMR)是具有非结构化句子和多种概念表达,为医学信息提取提供了丰富的信息。然而,庞大的数据信息严重影响处理效率,因此提取电子病历中的命名实体成为研究的热点问题。为提高医院对复杂数据的处理效率,减轻工作人员的压力,本文提出了一种基于条件随机场(CRF)模型和特征模板结合的算法,来识别中文电子病历中的命名实体单元,识别准确率可以达到92.9%,可以有效地识别电子病历命名实体。基于本文采用的方法可以来结构化电子病历,减轻医生负担,推动医疗领域的发展。
2021-05-20 15:39:27 14.32MB 机器学习 CRF 电子病历
1
本文对语音识别的主要过程进行了详细的介绍。在语音的特征参数提取阶 段,本文着重介绍了实际应用中经常使用的线性预测倒谱系数(LPCC)和美尔 频率倒谱系数(MFCC)等。本文主要研究了基于BP神经网络的语音识别,并 提出了基于MFCC与LPCC混合参数的语音识别方法,以更好地表现语音的特 征,避免传统的分段线性处理所产生的局限性,提高了识别性能。实验结果显示, 该方法比传统的MFCC参数的语音识别方法具有更好的识别性能。本文还对识 别系统中的BP神经网络进行了优化,改进了性能,缩短了训练时间,为将来移 植到嵌入式系统中打下了良好的基础。
2021-05-13 22:41:41 4.28MB 神经网络 语音识别
1
车型识别是智能交通系统中的一个重要组成部分,近年来已成为国内外研究热点之一。提出了一种基于特征提取的车型识别方法。该方法首先对车辆图像进行预处理;然后通过图像边缘检测、图像纵横填充、图像修正方法进行车型特征值提取,得到车型分类特征字空间;最后利用BP 神经网络进行车型分类识别。实验结果表明,该方法高效可行,并对低质量和背景复杂图像有着良好的处理效果。
1
运用智能手机传感器数据进行人类行为识别研究在医疗服务、智能环境和网络空间安全等领域有许多重要应用。目前,大多数的分类方法识别率都不高,尤其是在医疗服务领域。为了提高行为活动的识别准确率,先利用稀疏局部保持投影降维,将实验的数据集进行特征约简得到最优的实验特征子集,再用随机森林集成分类器完成了人类行为识别。实验结果证明,该方法不仅明显地降低了实验的特征数量,而且提高了整体精确度。
2021-05-06 19:55:22 683KB 论文研究
1