TecoGAN-PyTorch 介绍 这是TecoGAN的PyTorch重新实现:特mporally有限公司赫伦特GAN视频超分辨率(VSR)。 有关更多信息,请参考官方TensorFlow实现 。 特征 更好的性能:此仓库提供的模型比官方仓库更小但性能更好。 请参阅我们关于Vid4和ToS3数据集的。 多个降级:此存储库支持两种类型的降级,即BI和BD。 请参阅以获取有关降级类型的更多详细信息。 统一框架:此存储库为基于失真和基于感知的VSR方法提供了统一框架。 内容 致谢 依存关系 Ubuntu> = 16.04 NVIDIA GPU + CUDA 的Python 3 PyTorch> = 1.0.0 Python软件包:numpy,matplotlib,opencv-python,pyyaml,lmdb (可选)Matlab> = R2016b 测试 注意:我们会根
1
The goal of the Volume I Geometric Algebra for Computer Vision, Graphics and Neural Computing is to present a unified mathematical treatment of diverse problems in the general domain of artificial intelligence and associated fields using Clifford, or geometric, algebra. Geometric algebra provides a rich and general mathematical framework for Geometric Cybernetics in order to develop solutions, concepts and computer algorithms without losing geometric insight of the problem in question. Current mathematical subjects can be treated in an unified manner without abandoning the mathematical system of geometric algebra for instance: multilinear algebra, projective and affine geometry, calculus on manifolds, Riemann geometry, the representation of Lie algebras and Lie groups using bivector algebras and conformal geometry. By treating a wide spectrum of problems in a common language, this Volume I offers both new insights and new solutions that should be useful to scientists, and engineers working in different areas related with the development and building of intelligent machines. Each chapter is written in accessible terms accompanied by numerous examples, figures and a complementary appendix on Clifford algebras, all to clarify the theory and the crucial aspects of the application of geometric algebra to problems in graphics engineering, image processing, pattern recognition, computer vision, machine learning, neural computing and cognitive systems.
2021-10-28 23:37:50 17.3MB 计算机视觉
1
金字塔形卷积 这是我们的论文的PyTorch实现。 (请注意,这是ImageNet上图像识别的代码。有关语义图像分割/解析的信息,请参见以下存储库: : ) 在ImageNet上训练的模型可以在找到。 PyConv能够提供比基线更高的识别能力(有关详细信息,请参见)。 ImageNet上的准确性(使用默认培训设置): 网络 50层 101层 152层 ResNet 76.12%( ) 78.00%( ) 78.45%( ) PyConvHGResNet 78.48 %( ) 79.22 %( ) 79.36 %( ) PyConvResNet 77.88 %( ) 79.01 %( ) 79.52 %( ) 使用更复杂的训练设置(例如,使用附加数据增强(CutMix),将bach大小增加到1024,学习率0.4,余弦调度程序超过300个纪元以及使用混合精度来加
1
Learning-OpenCV-3-Computer-Vision-with-Python 书本PDF以及代码
2021-10-27 14:51:32 53.2MB OpenCV python 计算机视觉 图像处理
1
siamese-fc:使用完全卷积暹罗网络以50-100 FPS进行任意对象跟踪
1
VOT评估套件 该存储库包含用于的官方评估套件。 该存储库包含实际的评估工具包,它是一组Matlab(与Octave兼容)脚本,一个文档和一组用于不同编程语言的集成示例。 有关更多详细信息,请参阅源代码中的可用文档或的编译版本。 您还可以订阅VOT以接收有关挑战和重要软件更新的新闻,或加入我们的以提问。 单击浏览并下载该工具包的最新官方版本。 开发者 LukaČehovin(首席开发人员) 托马斯·伏伊日(TomášVojíř) 艾伦·卢克西奇(AlanLukežič) 贡献者 乔治·内贝海(Georg Nebehay) 亨彻肯 斯蒂芬·达夫纳(Stefan Duffner) 马里
2021-10-27 10:39:18 306KB performance computer-vision matlab evaluation
1
大事记 自然语言处理 神经网络的序列到序列学习[NIPS 2014] [] [] 端到端存储网络[NIPS 2015] [] [] 注意就是您所需要的[NIPS 2017] [] [] 乙idirectionalËncoderř对产权在T ransformers:BERT [] [] [] 改革者:高效变压器[ICLR2020] [] [] Linformer:具有线性复杂度的自我注意[AAAI2020] [] [] 简历 分类 图像价值16x16字:用于图像识别的变压器[VIT] [ICLR 2021] [] [] DeiT:数据高效的图像变压器[arxiv2021] [] [] 侦测 DETR:使用变压器进行端到端对象检测[ECCV2020] [] [] 可变形DETR:用于端到端对象检测的可变形变压器[ICLR2021] [] [] 分割 SETR:使用变压器从序列到序
2021-10-26 20:26:43 1KB computer-vision transformer papers
1
社交距离检测 您可以在此处找到包含完整算法和代码的视频:( ) Github通常不支持大于25 Mb的文件。您可以在找到yolo权重 下载并移至yolo-coco文件夹 对于CPU: 要在您的终端中运行此代码: *打开您的终端 更改目录至您下载此代码的位置 如果尚未安装python3,请先安装python3! 运行python3 -m venv venv创建一个名为venv的虚拟环境。 运行source venv/bin/activate激活您的环境! 编写pip install -r requirements.txt以安装与此项目相关的python依赖项,例如opencv,numpy,scipy等。 运行命令time python social_distance_detector.py --input pedestrians.mp4 --output output.avi --display 1运行您的社交距离检测项目 运行命令的最后一行后,将弹出一个窗口,执行该文件后,将在目录中显示一个output.avi文件,如下所示: 对于GPU: 您可以在这里找到我的Googl
2021-10-26 18:43:52 21.17MB computer-vision dataset yolo deeplearning
1
计算机视觉中的Transformer 在2017年谷歌设计了Transformer,并在NLP社区显示出了效果之后,有大量的工作专注于将其应用到计算机视觉社区。本文首先简要介绍了计算机视觉中的Transformer。然后,介绍了Transformer模型在低/高级视觉任务、模型压缩和主干设计方面的一些代表性工作。 曹越,现任微软亚洲研究院视觉计算组主管研究员,分别于2014年和2019年在清华大学软件学院获得本科和博士学位,曾于2017年获微软学者奖学金、2018年获清华大学特等奖学金。至今在CVPR、ICCV、ICLR、ICML、NeurIPS等国际会议和期刊中发表论文20余篇,其中有三篇入围PaperDigest Most Influential Papers榜单,谷歌引用五千余次。目前主要的研究兴趣是自监督学习、多模态学习以及自注意力建模。
2021-10-26 18:08:47 11.96MB transformer
1
ÇrowdÇountingÇODE框架(C ^ 3-框架) Python 3开发人员版本! 开源的PyTorch代码用于人群计数 注意:由于个人原因,该代码将不会继续保留。 我建议您在使用或其他出色的代码。 技术博客 [2019.05] [中文博客] C ^ 3框架系列之一:一个基于PyTorch的开源人群计数框架[] 目标 该代码的目的是一个有效,灵活的框架,用于监督人群计数。 同时,我们在主流数据集上提供了一些基本网络和经典算法的性能。 特征 方便的开发套件。 它是六个主要数据集上的便捷开发套件。 坚实的基线。 它提供了一些经典的预训练模型的基线,例如AlexNet,VGG,ResNet等。 在此基础上,您可以轻松地将建议的模型与它们的效果进行比较。 强大的日志。 它不仅可以在Tensorboard中记录丢失和可视化,还可以保存当前代码包(包括参数设置)。 保存的代码包可以直接运
1