使用点对特征进行曲面匹配 高效稳健的 3D 对象识别 drost2010CVPR(Computer Vision and Pattern Recognition) 示例文件包含在主模块中,也包含测试数据。
2022-08-31 09:07:10 353.54MB opencv ppf CVPR
1
先决条件 正在安装 只需在config.py文件中设置数据集路径。 # -*- coding: utf-8 -*- paths = dict( ANNOTATIONS='/example/of/path/MIT67/Annotations/', IMAGES='/example/of/path/MIT67/Images/' ) 跑步 $ python mit67.py 例子
2022-08-04 17:08:45 3KB Python
1
参考文献: 原论文名称:EfficientNetV2: Smaller Models and Faster Training 论文下载地址:https://arxiv.org/abs/2104.00298 原论文提供代码:https://github.com/google/automl/tree/master/efficientnetv2 参考博文:https://blog.csdn.net/qq_37541097/article/details/116933569?spm=1001.2014.3001.5502 参考在bilibili上的讲解视频:https://b23.tv/M4hagB
2022-06-20 16:05:39 5.73MB EfficientNetV2 CVPR2021 论文 CV
1
RDN 该存储库是。 要求 PyTorch 1.0.0 脾气暴躁的1.15.4 枕头5.4.1 h5py 2.8.0 tqdm 4.30.0 火车 可以从下面的链接下载转换为HDF5的DIV2K,Set5数据集。 数据集 规模 类型 关联 DIV2K 2个 火车 DIV2K 3 火车 DIV2K 4 火车 第5集 2个 评估 第5集 3 评估 第5集 4 评估 否则,您可以使用prepare.py创建自定义数据集。 python train.py --train-file " BLAH_BLAH/DIV2K_x4.h5 " \ --eval-file " BLAH_BLAH/Set5_x4.h5 " \ --outputs-dir " BLAH_BLAH/outputs " \
2022-06-08 09:07:56 3.57MB 网络 源码软件
pytorch-polygon-rnn Pytorch实现。 注意,我使用另一种方法来处理第一个顶点,而不是像本文中那样训练另一个模型。 与原纸的不同 我使用两个虚拟起始顶点来处理第一个顶点,如图像标题所示。 我需要在ConvLSTM层之后添加一个LSTM层,因为我需要输出为D * D + 1维度才能处理结束符号。 如何训练和测试 从下载数据,组织图像文件和注释json文件,如下所示: img ├── train │ ├── cityname1 │ │ ├── pic.png │ │ ├── ... │ ├── cityname2 │ │ ├── pic.png │ │ ├── ... ├── val │ ├── cityname │ │ ├── pic.png │ │ ├── ... ├── test │ ├── ci
1
通过隐式模块化视听表示进行姿势可控的会说话脸生成(CVPR 2021) ,孙亚生,,,和。 | | 我们提出了可姿势控制的视听系统(PC-AVS) ,该系统可在驱动带有声音的任意说话的面部时实现自由姿势控制。 代替从音频中学习姿势运动,我们利用另一个姿势源视频来仅补偿头部运动。 关键是设计一种隐含的低维姿势代码,该代码不包含嘴巴形状或身份信息。 通过这种方式,将视听表示模块化为三个关键因素的空间:语音内容,头部姿势和身份信息。 要求 使用Python 3.6和 1.3.0。 基本要求在“ requirements.txt”中列出。 pip install -r requirements.txt 快速入门:生成演示结果 下载预训练的检查点。 创建默认的文件夹./checkpoints并解压demo.zip在./checkpoints/demo 。 其中应该有5 pth 。 解压缩mi
2022-05-18 16:34:32 28.48MB Python
1
RDN 该存储库是。 要求 PyTorch 1.0.0 脾气暴躁的1.15.4 枕头5.4.1 h5py 2.8.0 tqdm 4.30.0 火车 可以从下面的链接下载转换为HDF5的DIV2K,Set5数据集。 数据集 规模 类型 关联 DIV2K 2个 火车 DIV2K 3 火车 DIV2K 4 火车 第5集 2个 评估 第5集 3 评估 第5集 4 评估 否则,您可以使用prepare.py创建自定义数据集。 python train.py --train-file " BLAH_BLAH/DIV2K_x4.h5 " \ --eval-file " BLAH_BLAH/Set5_x4.h5 " \ --outputs-dir " BLAH_BLAH/outputs " \
2022-05-13 21:04:12 3.57MB PyTorch
matlab代码放大 PyTorch版本 抽象的 基于模型的优化方法和判别式学习方法已成为解决低视力中各种逆问题的两种主要策略。 通常,这两种方法都有其各自的优缺点,例如,基于模型的优化方法可灵活地处理不同的逆问题,但出于性能良好的目的,通常以复杂的先验条件耗时; 同时,判别式学习方法测试速度较快,但其应用范围受到专门任务的极大限制。 最近的工作表明,借助可变分割技术,可以将去噪器先验插入为基于模型的优化方法的模块部分,以解决其他反问题(例如,去模糊)。 当通过判别学习获得降噪器时,这样的集成会带来相当大的优势。 但是,仍然缺乏与快速判别去噪器集成的研究。 为此,本文旨在训练一组快速有效的CNN(卷积神经网络)去噪器,并将其集成到基于模型的优化方法中,以解决其他逆问题。 实验结果表明,学习的去噪器集不仅可以实现有希望的高斯去噪结果,而且可以用作为各种低级视觉应用提供良好性能的先决条件。 基本思想 借助可变分裂技术,例如乘数交替方向方法(ADMM)和半二次分裂(HQS)方法,可以分别处理一般图像恢复公式的保真度项和正则项项,尤其是正则化项仅对应于降噪子问题。 因此,这可以将任何区分式去噪
2022-05-10 17:19:47 208.89MB 系统开源
1
CVPR 2022 LaTex 模板
2022-05-08 09:03:59 27KB 源码软件 latex CVPR2022
1