为了提高遥感图像语义分割的效果和分类精度,设计了一种结合ResNet18网络预训练模型的双通道图像特征提取网络。将多重图像特征图进行拼接,融合后的特征图具有更强的特征表达能力。同时,采用批标准化层和带有位置索引的最大池化方法进一步优化网络结构,提升地表目标物的分类准确率。通过实验,将所提方法与多种神经网络方法进行准确率和Kappa系数比较。结果显示,所提的网络结构可以在小数据量样本下取得90.68%的总体准确率,Kappa系数达到了0.8595。相比其他方法,所提算法取得了更好的语义分割效果,并且整体训练时间大幅缩短。
2021-11-25 14:49:30 20.86MB 图像处理 全卷积神 语义分割 双通道网
1
提出了一种基于多尺度特征融合的全卷积神经网络的视网膜血管分割方法, 无需手工设计特征和后处理过程。利用跳跃连接构建编码器-解码器结构全卷积神经网络, 将高层语义信息和低层特征信息进行融合; 利用残差块进一步学习细节和纹理特征; 利用不同空洞率的空洞卷积构建多尺度空间金字塔池化结构, 进一步扩大感受野, 充分结合图像上下文信息; 采用类别平衡损失函数解决正负样本不均衡问题。实验结果表明, 在DRIVE(Digital Retinal Images for Vessel Extraction)和STARE (Structured Analysis of the Retina)数据集上的准确率分别为95.46%和96.84%, 敏感性分别为80.53%和82.99%, 特异性分别为97.67%和97.94%, 受试者工作特征(ROC)曲线下的面积分别为97.71%和98.17%。所提方法相较于其他方法性能更优。
1
对于语音的情感识别,针对单层长短期记忆(LSTM)网络在解决复杂问题时的泛化能力不足,提出一种嵌入自注意力机制的堆叠LSTM模型,并引入惩罚项来提升网络性能。对于视频序列的情感识别,引入注意力机制,根据每个视频帧所包含情感信息的多少为其分配权重后再进行分类。最后利用加权决策融合方法融合表情和语音信号,实现最终的情感识别。实验结果表明,与单模态情感识别相比,所提方法在所选数据集上的识别准确率提升4%左右,具有较好的识别结果。
2021-05-08 15:47:48 2.99MB 图像处理 情感识别 全卷积神 长短期记
1