Inception v1原版论文,已标注重点
2022-12-08 19:30:35 1.35MB cnn cv
1
ResNet残差网络原版论文,已标注重点
2022-12-08 19:30:34 983KB cnn cv
1
GoogLeNet是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。 外文名GoogLeNet类 型神经网络 结构介绍 inception模块的基本机构如图1,整个inception结构就是由多个这样的inception模块串联起来的。inception结构的主要贡献有两个:一是使用1x1的卷积来进行升降维;二是在多个尺寸上同时进行卷积再聚合。 图1 图1 1x1卷积 作用1:在相同尺寸的感受野中叠加更多的卷积,能提取到更丰富的特征。这个观点来自于Network in Network,图1里三个1x1卷积都起到了该作用。 图2 图2 图2左侧是是传统的卷积层结构(线性卷积),在一个尺度上只有一次卷积;图2右图是Network in Network结构(NIN结构),
2022-12-07 12:27:40 31.19MB 深度学习 图像处理 CV
1
重要知识点经过批注的AlexNet论文原版
2022-12-06 17:26:35 1.39MB cnn cv
1
SIRT算法其思想在于利用通过该像素的全部射线,其迭代过程对图像每个像素的更新量是对所有投影线的修正按照贡献因子取加权平均,然后反投影得到。与ART每条投影线都对图像更新一次不同,SIRT算法综合了所有投影线的贡献,可以避免一条投影线上的误差对重建结果带来过大影响,因而可以有效抑制重建图像中的噪声。 2、算法实现步骤 (1)对第 条射线,计算估计投影值 (2)计算实际投影与估计投影的误差 (3)反投影值 其中, 是所有投影角度下光线的集合. (4)对第 个像素点的值进行修正 (5)将上一轮的结果作为初值,重复(1)~(4)的过程,直到达到收敛要求或指定的迭代次数。 因此,SIRT算法的迭代公式为: 其中, 是松弛因子, 是迭代次数。 3、优缺点分析 由于SIRT算法对所有投影线的修正量进行了加权平均,显著地降低了迭代的收敛速度。另一方面,对每个像素更新时,需要计算好所有投影线的贡献,因此在实际计算中需要对各个投影线的贡献量进行存储,存储量至少比ART算法多一倍。因此,SIRT算法具有更好的稳定性,但是收敛速度慢、存储容量大,此两点成为影响其应用的主要问题。
2022-12-06 15:25:51 771KB CT重建算法 CV
1
内容概要:人工智能CV入门Vgg16迁移学习猫狗分类实战代码及数据集;本内容为使用Pytorch对计算机视觉中的Vgg16迁移学习进行实战编码。本内容包含了实战教程使用的数据集及代码的jupyter notebook 能学到什么:通过此资源你可以学习到如何通过pytorch框架及python语言进行简单的计算机视觉中的Vgg16迁移学习猫狗分类算法实战,你可以对该算法有更加深入的理解,并且你也可以获得更强的实战能力。
2022-11-21 15:27:01 547.46MB 人工智能 ai 计算机视觉 分类算法
1
吉林大学海量视觉检索技术课程实验报告任务二 1、通读论文内容。 2、依据论文内容完成如下函数: 2.1 energyImage = energy_image(im),依据每个像素在X和Y方向的梯度幅值完成能量图的计算,其中输入图像im为MxNx3 格式为unint_8;输出energyImage为double型的矩阵; 2.2 cumulativeEnergyMap = cumulative_minimum_energy_map (energyImage, seamDirection);依据论文内容计算累计最小能量映射图,其中输入的energyImage为2.1的输出,seamDirection可选为“HORIZONTAL”或“VERTICAL”。输出为2D double型矩阵。 2.3 verticalSeam = find_optimal_vertical_seam(cumulativeEnergyMap) ;依据2.2中的函数计算最优垂直缝,其输入为2.2的输出,输出必须是包含像素的列索引的向量,以此形成每行的接缝。 2.4 horizontalSeam = find_op
2022-11-21 15:26:38 3.89MB cv 原创 吉林大学
1
欢迎来到我的Apple图片分类项目 在这个项目中,我探索了如何使用CNN和转移学习来建立图像分类器。 数据集包含从Google Image的“ iPhone”,“ iPad”和“ Macbook”的最高搜索结果中抓取的1500张图像。 完整的数据集可以在这里下载: : 。 目的是尝试创建图像分类器,以区分3种最主流的Apple产品-iPhone,iPad和Macbook。 从表面上看,它们可能会彼此混淆(没有缺口的旧版iPhone设计可能会误认为iPad,而带有键盘的新版iPad可能会误认为Macbook)。 虽然我们可以轻松区分它们,但我们可以教一个深度学习模型来做到这一点吗? 哪种方法可以使我们获得最高的准确性? 这些是将在本项目中回答的问题。 档案说明 该存储库中只有4个文件(自述文件和需求文件除外)。 该笔记本是一款Jupyter笔记本,可以在Google Colab(带有
2022-11-15 10:52:21 66.94MB JupyterNotebook
1
只看不练假把式。此 SIFT 特征检测源码 400+行,你可以挖掘到很多实现细节,甚至资料中找不到细节,或者是看文章看不懂的地方,值要细细研究代码,你就能恍然大悟。
2022-11-13 13:30:09 24KB sift算法 机器学习 计算机视觉 CV
1
CV_interviews_Q-A 不试着去找找实习,不试着被面试官毒打下,都意识不到自己基础的薄弱,很多东西被问到只知道个大概,再深挖一下为什么就支支吾吾答不上来了。深感CV算法岗竞争之激烈,从来都是狭路相逢勇者胜,借找工作的机会好好整理下所学的知识,希望现在好好准备还来时晚,一起努力向要约发起冲击吧! 本仓库汇总的CV算法岗重要的一些知识点和面试问答,主要分为计算机视觉,机器学习,图像处理和,C ++基础四大块,每个块都有几十个问题,每个问题都会努力做出的详细完整的解答,帮助您理清这些知识点细节。 为了刺激下大家的神经,激发斗志,在往下看之前可以先看看这份经验分享: 。创建本仓库的灵感也就是扩张此文,感谢大佬的分享〜 食用方法 额外添加转换过的PDF版,如果直接下载md文件显示不了一些图片或者公式的话,可以匹配PDF版学习。--2020.08.14 github上直接看的话很多公式和
2022-11-08 15:36:33 36.59MB
1