介绍 这是共识感知视觉语义嵌入(CVSE) ,这是论文《的官方源代码。 它基于PyTorch中的构建。 抽象的: 图像文本匹配在桥接视觉和语言方面起着核心作用。 大多数现有方法仅依靠图像-文本实例对来学习它们的表示,从而利用它们的匹配关系并进行相应的对齐。 这样的方法只是利用实例成对数据中包含的表面关联,而没有考虑任何外部常识知识,这可能会阻碍它们推理图像和文本之间更高层次关系的能力。 在本文中,我们提出了一种共识感知视觉语义嵌入(CVSE)模型,以将共识信息(即两种模式之间共享的常识知识)整合到图像文本匹配中。 具体而言,通过计算来自图像字幕语料库的语义概念之间的统计共现相关性,并部署构造的概念相关图以产生共识感知概念(CAC)表示,来利用共识信息。 之后,CVSE基于所利用的共识以及两种模式的实例级表示形式,学习图像与文本之间的关联和对齐方式。 在两个公共数据集上进行的大量实验证明
2021-07-14 15:46:05 214.1MB Python
1
不受约束的视频中的视听事件本地化(出现在ECCV 2018中) AVE数据集和功能 可以从下载AVE数据集。 和(7.7GB)也已发布。 在运行代码之前,请先将AVE数据集的视频放入/ data / AVE文件夹,将功能放入/ data文件夹。 用于生成音频和视频功能的脚本: ://drive.google.com/file/d/1TJL3cIpZsPHGVAdMgyr43u_vlsxcghKY/view?usp=sharing(可以随意修改并使用它来处理音频和视频数据)。 要求 Python-3.6,Pytorch-0.3.0,Keras,ffmpeg。 可视化注意力图 运行:pythontention_visualization.py生成音频引导的视觉注意图。 有监督的视听事件本地化 测试: 本文中的A + V-att模型:python supervised_main.py -
1
MSRN_PyTorch 该存储库是论文“用于图像超分辨率的多尺度残差网络”的官方PyTorch实施。 可以从下载论文 可以从下载所有测试数据集(预处理的HR图像)。 所有原始测试数据集(HR图像)都可以从下载。 我们的MSRN直接在Y通道上进行了培训和测试。 但是,越来越多的SR模型在RGB通道上进行训练。 为了公平起见,我们根据代码对MSRN进行了重新培训。 我们发布了该项目的新代码和结果。 旧代码被移到OLD /文件夹中。 新代码存储在MSRN /文件夹中。 更新2019.06.12.1 先前提供的再训练模型使用DIV2K(1-895)。 我们更正了此错误,并提供了重新训练的模型(DIV2K 1-800)和结果。 我们现在还提供了x8结果! 请注意,我们仅使用800张图像(DIV2K 1-800)进行训练,并使用最新的重量文件进行测试。 更新2019.06.12.2
2021-06-23 11:42:34 407.85MB super-resolution eccv eccv-2018 msrn
1
CV三大顶会论文列表,包括论文名称和作者,CSV文件方便查询和筛选
2021-04-21 15:29:02 376KB CVPR ECCV ICCV
1
English | SNE-RoadSeg2 介绍 此SNE-RoadSeg2基于SNE-RoadSeg的官方pytorch实现的,已被接受。这是他们的。 在此,我们为提供了培训和测试设置。我们在Python 3.7,CUDA 10.0,cuDNN 7和PyTorch 1.1中测试我们的代码。我们提供Dockerfile来构建我们使用的Dockerfile映像。 设置 请根据以下文件夹结构设置KITTI道路数据集和预训练的权重: SNE-RoadSeg |-- checkpoints | |-- kitti | | |-- kitti_net_RoadSeg.pth |-- data |-- datasets | |-- kitti | | |-- training | | | |-- calib | | | |-- depth_u16 |
1
车辆X 该存储库包含ECCV2020中论文“使用属性下降模拟内容一致的车辆数据集”的代码。 VehicleX数据还与和。 相关资料:,,6, 。 您可以使用我们的快速浏览我们的数据。 该演示包含1362个中的70个id。使用VehicleX图像的整个过程分为三个步骤: 属性分布学习,并通过VehicleX引擎生成具有学习到的属性的图像(内容级别域适配); 对生成的图像执行样式级别域适配(SPGAN); 训练用于样式转换图像的re-ID模型。 这三个步骤的代码分别在,./ 和上可用。 欢迎您将代码的每个部分用于研究目的。 VehicleX的Unity源代码也可在上。 Vehicle
2021-03-23 15:33:59 115.02MB unity re-identification reid vehicle-reid
1
IoU预测的概率锚分配用于对象检测 姜金和熙锡李。 这是基于和 Probabilistic Anchor Assignment with IoU Prediction for Object Detection的PyTorch实现()。 笔记 现在,该代码支持PyTorch 1.6 。 在可以使用PAA。非常感谢的出色工作! 介绍 在对象检测中,确定将哪些锚分配为正样本或负样本(称为锚分配)已被公认为是可以严重影响模型性能的核心过程。在本文中,我们提出了一种新颖的锚点分配策略,该策略根据模型的学习状态将锚点自适应地分为正样本和负样本,用于地面真值边界框,从而能够以概率方式推理出分离。为此,我们首先计算以模型为条件的锚点的分数,并对这些分数拟合概率分布。然后使用根据锚概率分为正样本和负样本的锚对模型进行训练。此外,我们调查了培训和测试目标之间的差距,并建议预测检测到的盒子的交集在交集上,以作为
2021-03-18 17:09:14 4.67MB Python
1
首先感谢作者陈育圣和莊永裕为我们展现出如此优秀的作品《基於全局相似转换的猜测之自然影像拼接》,资源为该论文的电子文档(核心部分做了翻译,可能存在瑕疵,敬请谅解),文档仅用于学习,请用到该文章的做好引用声明。 Chen Y S,Chuang Y Y. Natural image stitching with the global similarity prior[C]//Proceedings of the 14th European Conference on European Conference on Computer Vision. Amsterdam,Netherlands: Springer,2016: 186-201. [DOI: 10.1007 /978-3-319-46454-1_12]
2020-01-03 11:32:08 13.79MB 图像拼接 NISwGPS ECCV 多图拼接
1
ECCV (European Conference on Computer Vision) ECCV_005.pdf
2020-01-03 11:23:19 178.07MB ECCV 2016
1
ECCV (European Conference on Computer Vision) ECCV_006.pdf
2020-01-03 11:23:19 211.21MB ECCV 2016
1