为了提高利用深度神经网络预测单图像深度信息的精确度,提出了一种采用自监督卷积神经网络进行单图像深度估计的方法。首先,该方法通过在编解码结构中引入残差结构、密集连接结构和跳跃连接等方式改进了单图像深度估计卷积神经网络,改善了网络的学习效率和性能,加快了网络的收敛速度;其次,通过结合灰度相似性、视差平滑和左右视差匹配等损失度量设计了一种更有效的损失函数,有效地降低了图像光照因素影响,遏制了图像深度的不连续性,并能保证左右视差的一致性,从而提高深度估计的鲁棒性;最后,采用立体图像作为训练数据,无需标深度监督信息,实现了端到端的单幅图像深度估计。在 Tensorflow框架下,用KIT和 Cityscapes数据集进行实验结果表明,与目前的主流方法相比,该方法在预测深度的精确度方面有较大提升,拥有更好的深度预测性能。
2024-05-28 17:31:59 724KB
1
自监督学习相关论文 Self-supervised Learning for Linking Knowledge Graphs(TKDE21)
2022-12-21 16:28:38 3MB 自监督
1
本文对基于深度学习的自监督一般性视觉特征学习方法做了综述。首先,描述了该领域的动机和一些专业性术语。在此基础上,总结了常用的用于自监督学习的深度神经网络体系结构。接下来,回顾了自监督学习方法的模式和评价指标,并介绍了常用的图像和视频数据集以及现有的自监督视觉特征学习方法。最后,总结和讨论了基于标准数据集的性能比较方法在图像和视频特征学习中的应用。
2022-08-16 01:47:50 23.57MB self_supervised_
1
这些年在计算机视觉领域中的自监督学习- 计算机视觉.pdf
2022-04-21 19:10:36 2.94MB 计算机视觉 学习 人工智能
OpenIBL 介绍 OpenIBL是基于PyTorch的开源代码库,用于基于图像的本地化(换句话说,就是位置识别)。 它支持多种最新方法,还涵盖了ECCV-2020聚光灯SFRS的正式实施。 我们支持由slurm或pytorch启动的单/多节点多GPU分布式培训和测试。 正式执行: :用于大规模图像定位的自监督细粒度区域相似性(ECCV'20 Spotlight ) 非官方实施: NetVLAD:用于弱监督位置识别的CNN架构(CVPR'16) SARE:用于大规模图像定位的随机吸引-排斥嵌入(ICCV'19) 常问问题 如何提取单个图像的描述符? 请参阅。 如何在论文中
1
对比学习综述 介绍了对比学习损失InfoNCE的起源 详细介绍了对比学习的起源,发展,从CPC到MAE,从图像到文本SimCSE,再到表格数据Tabular
2022-02-08 12:05:41 3.53MB 对比学习 自监督 综述 表格数据
1
自监督学习(Self-supervised learning)最近获得了很多关注,因为其可以避免对数据集进行大量的标签标注。它可以把自己定义的伪标签当作训练的信号,然后把学习到的表示(representation)用作下游任务里。最近,对比学习被当作自监督学习中一个非常重要的一部分,被广泛运用在计算机视觉、自然语言处理等领域。它的目标是:将一个样本的不同的、增强过的新样本们在嵌入空间中尽可能地近,然后让不同的样本之间尽可能地远。这篇论文提供了一个非常详尽的对比自监督学习综述。
2022-01-23 22:33:07 5.72MB 对比学习
1
vision transformer self-supervised
2021-12-06 17:01:57 1.7MB 自监督 transformer 计算机视觉
1
机器学习 深度学习 pytorch tensorflow 贝叶斯 神经网络 算法
2021-11-30 13:01:25 8.06MB 机器学习 深度学习 tensorflow pytorch
国际表示学习大会(The International Conference on Learning Representations)是致力于人工智能领域发展的国际知名学术会议之一。为了分析最新研究动向,本文精选了涵盖自监督学习、Transformer、图神经网络、自然语言处理、模型压缩等热点领域,将分多期为大家带来系列论文解读。
2021-11-14 21:37:05 14.41MB 自监督学习 Transformer
1