SSD 算法利用多尺度特征图进行分类和位置回归,检测小目标效果优于 YOLO 算法,但 SSD 算法在进行车辆检测时存在漏检问题。为此,提出一种改进 SSD 算法。为提取更多的车辆特征信息,设计改进 Inception 模块替代 SSD 网络中的 Conv8、Conv9 和 Conv10 层。将浅层特征的位置信息和深层特征的语义信息进行均衡化融合,构建多尺度特征融合均衡化网络,提高小目标车辆识别率。在特征提取层均引入 SENet,对不同特征通道的重要性进行重标定以提高模型性能。实验结果表明,改进后 SSD 算法在自制的车辆数据集上平均精度为 90.89%,检测速度达到 59.42 frame/s,相比改进前的 SSD 算法,在精度和速度上分别提高 2.65 个百分点和 17.41 frame/s,能够更快速、准确地对图像中的车辆进行识别和定位。
2022-06-26 16:08:34 1.94MB 小目标检测 SSD 注意力机制 车辆检测
海面目标检测图像中的小目标数量居多,而基于深度学习的目标检测方法通常针对通用目标数据集设计检测模型,对图像中的小目标检测效果并不理想。 使用一般目标检测模型检测海面目标图像的特征时,通常会出现小目标漏检情况,而一些特定的小目标检测模型对海面目标的检测效果还有待验证。 为此,在标准的SSD( single shot multiBox detector)目标检测模型基础上,结合 Xception 深度可分卷积,提出一种轻量 SSD 模型用于海面目标检测。 方法 在标准的 SSD 目标检测模型基础上,使用基于 Xception 网络的深度可分卷积特征提取网络网络中的 exit flow 层和 Conv1 层引入轻量级注意力机制模块来提高检测精度,并与在其他层引入轻量级注意力机制模块的模型进行检测效果对比;使用注意力机制改进的轻量 SSD 目标检测模型和其他几种模型分别对海面目标检测数据集中的小目标和正常目标进行测试。
回归预测 | MATLAB实现TPA-LSTM(时间注意力注意力机制长短期记忆神经网络)多输入单输出(完整源码和数据) 多输入单输出,运行环境MATLAB2020b及以上,运行主文件TPAMain.m即可。
matlab出图,运行保障,代码有详细说明,适用初学者。
2022-06-07 20:06:50 139KB matlab lstm 源码软件 开发语言
实体关系抽取旨在识别网络文本中的实体,并提取出文本中实体之间隐含的关系。研究表明,深度神经网络在实体关系抽取任务上具有可行性,并优于传统关系抽取方法。目前的关系抽取方法大都使用卷积神经网络(CNN)和长短期记忆神经网络(LSTM),然而CNN只考虑连续词之间的相关性而忽略了非连续词之间的相关性。另外,LSTM虽然考虑了长距离词的相关性,但提取特征不够充分。针对这些问题,提出了一种CNN和LSTM结合的实体关系抽取方法,采用3种结合方法进行了实验,验证了该方法的有效性,在F1值上有一定的提升。
1
机器翻译 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。 其主要的步骤包括数据预处理、分词、建立词典、载入数据集、Encoder-decoder、seq2seq等。 注意力机制与Seq2seq模型 在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量(context vector)来获取输⼊序列信息。当编码器为循环神经⽹络时,背景变量来⾃它最终时间步的隐藏状态。将源序列输入信息以循环单位状态编码,然后将其传递给解码器
2022-05-18 22:02:21 64KB AS c fo
1
定位相关的Tacotron 的PyTorch实现。 音频样本可以在找到。 可以在找到Colab演示。 图1: Tacotron(具有动态卷积注意)。 图2:示例梅尔谱图和注意图。 快速开始 确保您已安装Python 3.6和PyTorch 1.7或更高版本。 然后安装此软件包(以及): pip install tacotron univoc 用法示例 import torch import soundfile as sf from univoc import Vocoder from tacotron import load_cmudict , text_to_id , Tacotron # download pretrained weights for the vocoder (and optionally move to GPU) vocoder = Vocoder .
2022-05-18 18:11:43 1021KB text-to-speech pytorch tts speech-synthesis
1
U-Net理论课进阶、注意力机制、教程
1
空对地环境下成像视角单一,且需要依靠深层网络提供强特征表达能力。针对深层网络存在的计算量大、收敛速度慢等问题,在稠密连接网络(DenseNet)框架下,提出了一种用通道差异化表示的目标检测网络模型。首先,用DenseNet作为特征提取网络,并用较少的参数加深网络,以提高网络对目标的提取能力;其次,引入通道注意力机制,使网络更关注特征层中的有效特征通道,重新调整特征图;最后,用空对地目标检测数据进行了对比实验。结果表明,改进模型的平均精度均值比基于视觉几何组(VGG16)的单步多框检测算法高3.44个百分点。
2022-05-12 16:32:38 5.77MB 图像处理 目标检测 特征提取 通道注意
1