CV-BOM数据管理系统-业务工作总结-汽车领航人云盘
2022-12-20 14:21:45 9.27MB 文档资料
1
街道场景的语义分割 1)下载资料 脚步 转到 (需要创建帐户) 下载gtFine_trainvaltest.zip和leftImg8bit_trainvaltest.zip 解压缩并将它们放到同一文件夹中 删除gtfine和leftImg8bit内的test目录,这些注释是虚拟注释。 使用data_folder_format.ipynb从每个城市文件夹中提取原始图像和注释,并将它们组合为一个用于图像的大文件夹和一个用于注释的大文件夹。 2)建立用于图像分割的TFRecords数据集 由于我们正在使用的数据集可能太大而无法容纳到内存中,因此我们需要一种在训练过程中连续从磁盘流式传输数据的方法。 这是使用TensoFlow的tf.data.dataset API完成的,该API需要我们将数据集序列化为.tfrecords文件。 使用dataset_build.ipynb来执行此过程,该
2022-12-14 21:01:30 1.34MB JupyterNotebook
1
面试72经计算机视觉_机器学习_图像处理_ C++_CV岗面试知识点及重点问答.zip 根据自己的面试经历,增加了一些内容,并修改了一些了答案,仅供参考,不一定都对。 文件名带?的,表示答案不完整。 markdown阅读软件建议为Typora,建议Typora主题修改为Mo,个人感觉比较好看。 文献管理软件可以使用Zotero,正版免费。 笔记软件可以Typora+坚果云+Picgo。 主要分为计算机视觉、机器学习、图像处理和、C++基础 四大块,每一块都有几十个问题,每个问题都会努力给出详细完整的解答,帮助你理清这些知识点细节。
人头检测,采用YOLO7TINY训练模型,只需要OPENCV和ONNX,不需要其他依赖。C++和PYTHON语言都有
2022-12-10 09:28:19 54.37MB CV
1
照片卡通化,只需要OPENCV和ONNX,VC++可以直接包含头文件、库文件,将图片卡通化,傻瓜式操作,有C++和PYTHON两种版本
2022-12-10 09:28:18 79.3MB CV
1
视频内容摘取,只需要OPENCV和ONNX,能将里面的人物摘取出来,有C++和PYTHON两种版本
2022-12-10 09:28:18 70.26MB CV
1
VGG原版论文,重点标注
2022-12-08 19:30:36 284KB cnn cv
1
Inception v1原版论文,已标注重点
2022-12-08 19:30:35 1.35MB cnn cv
1
ResNet残差网络原版论文,已标注重点
2022-12-08 19:30:34 983KB cnn cv
1
GoogLeNet是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。 外文名GoogLeNet类 型神经网络 结构介绍 inception模块的基本机构如图1,整个inception结构就是由多个这样的inception模块串联起来的。inception结构的主要贡献有两个:一是使用1x1的卷积来进行升降维;二是在多个尺寸上同时进行卷积再聚合。 图1 图1 1x1卷积 作用1:在相同尺寸的感受野中叠加更多的卷积,能提取到更丰富的特征。这个观点来自于Network in Network,图1里三个1x1卷积都起到了该作用。 图2 图2 图2左侧是是传统的卷积层结构(线性卷积),在一个尺度上只有一次卷积;图2右图是Network in Network结构(NIN结构),
2022-12-07 12:27:40 31.19MB 深度学习 图像处理 CV
1