自动生成图片描述是自然语言处理和计算机视觉的热点研究话题,要求计算机理解图像语义信息并用人类自然语言的形式进行文字表述.针对当前生成中文图像描述整体质量不高的问题,提出首先利用FastText生成词向量,利用卷积神经网络提取图像全局特征;然后将成对的语句和图像〈S,I〉进行编码,并融合为两者的多模态特征矩阵;最后模型采用多层的长短时记忆网络对多模态特征矩阵进行解码,并通过计算余弦相似度得到解码的结果.通过对比发现所提模型在双语评估研究(BLEU)指标上优于其他模型,生成的中文描述可以准确概括图像的语义信息.
1
LSTM(Long Short Term Memory,长短期记忆网络)介绍 介绍:LSTM,也就是长短期记忆网络,是一种 RNN 特殊的类型,可以学习长期依赖信息。要想较好理解LSTM请先查看之前写的RNN的简单理解文章。在传统RNN训练经常会出现无法解决长期依赖、梯度消失和梯度爆炸的问题,学习能力有限,在实际任务中的效果往往达不到预期效果。此时引入LSTM,LSTM是RNN的一种变体,是为了解决长期依赖问题而专门设计出来的,可以对有价值的信息进行长期记忆,减小了循环神经网络的学习难度。 应用领域:语音识别、语言建模、机器翻译、命名实体识别、图像描述文本生成。 图说LSTM结构 LSTM图标
2022-03-16 19:53:33 169KB lstm sigmoid 长短期记忆
1
针对目前癫痫发作实时自动预测困难的问题,将开展以LSTM模型为基础的癫痫发作预测的研究,构建了基于LSTM的神经网络模型对癫痫发作进行预测。将采集到的癫痫脑电数据进行预处理,然后提取单导联脑电小波能量特征,结合构建的基于LSTM的模型来识别癫痫发作前期和发作间期的状态,从而实现癫痫发作的预测。与传统的SVM和MLP相比,本方法取得了98.5%的分类精度和零误警的结果。为未来开发癫痫发作预警系统提供了理论基础,在临床应用上具有较大的潜在价值。
1
自动驾驶汽车技术近年来得到了广泛研究与快速发展,但在复杂的交通场景下,自动驾驶汽车面对突然出现的行驶车辆并不能及时避让。针对此问题,基于区块链技术提出智能网联车队的协同轨迹预测系统,智能网联车队中的各个节点与路边基础设施通过长短时记忆网络(LSTM)模型对周边车辆的运动轨迹进行预判,并将得到的结果进行分享,利用区块链技术,智能网联车队与路边基础设施可以对其接收到的信息进行评分,并将汇总后的评分以区块的形式加入存储信誉评分的区块链中。通过该评分,智能网联车队中的车辆可以根据车队中其他节点的信誉值来判断其是否可信,低信誉值节点传来的信息将不予理睬,从而实现了协同驾驶。实验分析表明,所提LSTM模型能够较为准确地预测周边车辆5 s内的行驶轨迹,而所提的系统在提升智能网联车队的行驶安全上起到了明显的效果。
1
当前基于油中溶解气体分析(DGA)的变压器故障诊断方法往往仅考虑单一时刻数据点,容错性差,难以充分挖掘在线监测数据的时序信息。提出一种考虑变压器油特征参量序列间复杂关系的基于双向长短时记忆(Bi-LSTM)网络的变压器故障诊断方法。首先构建了变压器油特征参量序列,基于序列数据构建了Bi-LSTM变压器故障诊断模型。工程实际中不同变压器油特征参量序列长短不一,需通过排序、分组填充对模型输入进行重构改进,然后对超参数进行优化。基于同一自建数据库对比所提方法与其他方法,结果表明:经过数据重构后所提方法的准确率可达91.9 %;当特征指标数量减少约2/3时,所提方法的准确率仅下降约1%,而其他方法的准确率平均下降约6 %;当采样数据存在10%的随机错误时,所提方法诊断准确率仅下降2%~6 %,且通过改变隐藏层的数量可得到改善。
1
我国城市轨道交通已进入快速发展期,准确预测城轨交通短时客流量,对于城轨运营安全、运营效率及运营成本具有重要意义.城轨交通短时客流量由于具有强随机性、周期性、相关性及非线性的特征,浅层模型的预测精度并不理想.对此,基于深度信念网络(DBN)和支持向量回归机(SVM),提出城轨交通短时客流深层预测模型(DBN-P/GSVM),同时基于遗传算法(GA)和粒子群算法(PSO)实现SVM的参数寻优.最后,对成都地铁火车北站客流量预测进行实例分析.结果表明,DBN-P/GSVM深度预测模型在均方误差、均方根误差、绝对误差均值及绝对百分比误差均值等方面均优于浅层模型——GA-SVM模型、PSO-SVM模型和BP神经网络模型,以及深层模型长短期记忆网络(LSTM)与LSTM-Softmax.
1
针对注意缺陷多动障碍(attention deficit hyperactivity disorder,ADHD)儿童和正常儿童的分类问题,实验采用经典干扰控制任务范式对两类儿童的事件相关电位(event-related potential,ERP)进行了研究,旨在通过ERP特征实现其分类。实验首次使用长短期记忆(long-short term memory,LSTM)方法分析两类儿童前额叶与顶枕叶脑区最佳电极(p<0.05)潜伏期(200~450 ms)的脑电信号,并自动学习和分类其ERP特征。相比常规分类方法,LSTM方法的分类率略高,可达95.78%。研究结果表明LSTM方法有助于ADHD儿童脑电信号的分类,为ADHD儿童个体诊断技术提供了一种新思路。
1
滚动轴承的运行状态对整机工作状态影响重大, 但目前其故障诊断方法存在依赖手工特征提取、鲁棒性不高等问题. 因此, 本文提出了一种基于改进的一维卷积神经网络(1D-CNN)和长短期记忆网络(LSTM)集成的滚动轴承故障诊断方法(1D-CNN-LSTM). 首先, 利用改进的1D-CNN-LSTM模型对滚动轴承6种不同的工作状态进行了分类识别实验, 实验结果表明提出的分类模型能够以较快的速度识别出滚动轴承的不同状态, 平均识别准确率达99.83%; 其次, 将提出的模型与部分传统算法模型进行对比实验, 结果表明所提方法在测试精度方面有较大优势; 最后, 引入迁移学习测试模型的鲁棒性和泛化能力, 实验结果表明提出的改进模型在不同工况下有较好的适应性和高效性, 模型有较强的泛化能力, 具备工程应用的可行性.
1
针对传统数据驱动的故障诊断方法难以从QAR数据中提取有效特征的问题,提出一种融合卷积神经网络(convolutional neural network,CNN)与长短时记忆网络(long short-term memory,LSTM)的双通道融合模型CNN-LSTM。CNN与LSTM分别作为两个通道,通过注意力机制(attention)融合,从而使模型能同时表达数据在空间维度和时间维度上的特征,并以时间序列预测的方式验证融合模型特征提取的有效性。实验结果表明,双通道融合模型与单一的CNN、LSTM相比,能够更有效地提取数据特征,模型单步预测与多步预测误差平均降低35.3%,为基于QAR数据的故障诊断提供一种新的研究思路。
1
在金融二级市场上对数据的分析方法主要是基于统计学和人工建模的方法,本文的提出了使用神经网络的方法分析二级市场金融数据。本文首先提出了在金融二级市场上使用神经网络方法的思路,其次证明了在二级市场使用神经网络进行数据分析的可行性,并且根据金融数据的特点设计出一种适合于处理金融数据的CNN-LSTM网络来处理数据。该网络对比传统的简单的统计方法和一些神经网络方法比如逻辑回归,卷积神经网络(CNN),长短期记忆网络(LSTM)等方法,在对市场价格变化在较短时间内的预测和在较长时间内的预测都有显著的提高,比简单的统计方法提高10%,比其他神经网络提高5%。提出了一种能够较为有效分析金融二级市场数据的方法。
1