关于计算机视觉的电子书,最新版本,经典著作,适合工学理学等领域
2023-04-15 02:36:13 22.29MB Computer Vision
1
毕业设计 这是我使用“深度学习”的学士学位毕业项目的仓库。
2023-04-12 21:15:11 360.33MB computer-vision deep-learning HTML
1
学习丰富的功能以进行真实图像还原和增强(ECCV 2020) , , , , , 和 论文: : 补充文件: 视频演示: : 摘要:为了从降级版本中恢复高质量图像内容,图像恢复在监视,计算摄影,医学成像和遥感等领域拥有众多应用。 最近,卷积神经网络(CNN)与传统的图像恢复任务方法相比取得了巨大的进步。 现有的基于CNN的方法通常以全分辨率或渐进式低分辨率表示形式运行。 在前一种情况下,获得了空间精确但上下文上不那么健壮的结果,而在后一种情况下,生成了语义上可靠但空间上不太准确的输出。 在本文中,我们提出了一种新颖的体系结构,其总体目标是通过整个网络维护空间精确的高分辨率表示,并从低分辨率表示接收强大的上下文信息。 我们方法的核心是包含几个关键元素的多尺度残差块:(a)并行多分辨率卷积流,用于提取多尺度特征;(b)跨多分辨率流的信息交换;(c)空间和渠道关注机
1
霍夫变换检测圆代码MATLAB 计算机视觉项目地球检测 在混乱的环境中进行政治地球仪检测 计算机视觉中的常见问题是在图片或视频流中搜索并找到特定的对象或形状。 在这个特殊的项目中,我们被要求设计和实施一个完整的程序,该程序可以通过选择可用的工具或编写我们自己的代码来识别任何方向和混乱环境中的小政治世界。 要运行该算法,请在Matlab中打开文件“ globe.m”。 它使用文件Hough Circles,DiscardDuplicateCircles,DiscardInnerCircles,DiscardNonEnclosedCircles查找图像中的圆。 完全包含在另一个圆中的圆被丢弃。 同样,不完全位于图像中的圆圈也将被丢弃。 经过初步处理并使用霍夫变换找到圆后,我们检测经度和纬度形成的平方以检测地球。 文件HoughLines,SeparateHorVerLines,DiscardDuplicateLines,DiscardNonHorVerLines,FindSquares用于查找图像中的正方形。 有关该项目的详细信息,请参见-。
2023-04-11 00:29:38 12KB 系统开源
1
交互是一种用于AI代理的逼真的可交互框架。 消息 (6/2020)我们提供了一个微型框架,以简化在Docker中运行AI2-THOR的工作。 可以通过以下网址访问它: : 。 (4/2020)框架的版本2.4.0更新在这里。 现在,所有不属于环境结构的sim对象都可以通过物理相互作用移动。 添加了新的对象类型,并添加了许多新的动作。 请在查看 (2/2020)AI2-THOR现在包括两个框架: 和 。 iTHOR包含交互式对象和场景,而RoboTHOR包含模拟场景及其对应的真实世界副本。 (9/2019)已添加框架2.1.0版更新。 添加了新的对象类型。 添加了新的初始化操作。 分割图像的生成在所有场景中都得到了改善。 (6/2019)AI2-THOR框架的2.0版更新现已发布! 我们的动作和对象状态增加了三倍,增加了新的动作,可以在视觉上进行明显的状态更改,例如电子设备上的屏幕
1
道路分割 合作者: 目录 : 介绍 该项目是 “模式分类和机器学习”课程的一部分。 更具体地说,这是我们针对道路分割的第二个项目的解决方案。 该文件概述了我们的代码及其功能。 有关该项目本身的所有其他说明,可以在其官方文件( paper.pdf文件)中找到。 该项目的目标是通过确定哪些16x16像素斑块是道路还是不是道路来分割地球的卫星图像。 简而言之,该代码运行第一个卷积神经网络以获得基本预测。 此后,它运行第二个,即后处理一个,它使用先前计算的预测来给出最终预测。 结果 我们取得了约0.91的F1分数,下面您将看到一个图像,说明所获得的定性结果。 在图像上,每个检测到的道路补丁都以
1
Adrian Rosebrock 的Deep Learning for Computer Vision with Python 1,2,3都在里面了。我自己没看过,但是我在看他opencv教程,倒是蛮不错的。
2023-03-30 20:31:13 60.5MB deeplearning opencv CV
1
令人敬畏的图像着色 基于深度学习的图像着色论文和相应的源代码/演示程序的集合,包括自动和用户指导(即与用户交互)的着色,以及视频的着色。 随意创建PR或问题。 (首选“拉式请求”) 大纲 1.自动图像着色 纸 来源 代码/项目链接 ICCV 2015 深着色 ICCV 2015 学习表示形式以实现自动着色 ECCV 2016 [项目] [代码] 彩色图像着色 ECCV 2016 [项目] [代码] 让有颜色!:全局和局部图像先验的端到端联合学习,以实现同时分类的自动图像着色 SIGGRAPH 2016 [项目] [代码] 通过生成对抗网络进行无监督的多样化着色 ECML-PKDD 2017 [代码] 学习多样的图像着色 CVPR 2017 [代码] 多种着色的结构一致性和可控性 ECCV 2018 使用有限的数据进行着色:通过内存增强网络进行少量着色 CVP
1
多摄像机人员跟踪和重新识别(使用视频) 用于“检测/跟踪”和“重新识别”不同摄像机/视频中的个人的简单模型。 介绍 该项目旨在跟踪不同角度的视频中的人。 用于完成此任务的框架分别依靠MOT和ReID来跟踪和重新标识人类的ID。 可以使用YOLO_v3或YOLO_v4来完成跟踪,并且ReID依赖于KaiyangZhou的Torchreid库。 安装 如果您的计算机上未安装 ,请下载 克隆存储库 git clone https : // github . com / samihormi / Multi - Camera - Person - Tracking - and - Re - Identification 创建项目环境 cd Multi - Camera - Person - Tracking - and - Re - Identification conda create
2023-03-22 15:57:54 50.11MB tracking video computer-vision tensorflow
1
补丁VQ Patch-VQ:“修补”视频质量问题 演示版 请按照 测试在LSVQ数据库上预训练的Patch VQ模型。 请按照在您的数据库上测试我们的Patch VQ模型。 下载LSVQ数据库 描述 对于社交和流媒体应用程序,无参考(NR)感知视频质量评估(VQA)是一个复杂,尚未解决的重要问题。 需要有效,准确的视频质量预测器来监视和指导数十亿个用户共享内容(通常是不完美的内容)的处理。 不幸的是,当前的NR模型在真实的,“野生的” UGC视频数据上的预测能力受到限制。 为了推进这一问题的发展,我们创建了迄今为止最大的主观视频质量数据集,其中包含39,000个真实世界的失真视频和117,000个时空本地化的视频补丁(“ v-patches”),以及5.5M人类的感知质量注释。 使用此工具,我们创建了两个独特的NR-VQA模型:(a)基于本地到全球区域的NR VQA体系结构(称为PVQ)
1