PyTorch图像模型 赞助商 非常感谢我的的支持! 除了以上链接的赞助商之外,我还从以下位置获得了硬件和/或云资源: 英伟达( ) TFRC( ) 我很幸运能够自己投入大量时间和金钱来支持这个项目和其他开源项目。 但是,随着项目范围的扩大,需要外部支持来继续当前的硬件,基础设施和电力成本轨迹。 什么是新的 2021年5月5日 从添加MLP-Mixer模型和端口预训练权重 从添加CaiT模型和预训练权重 从添加ResNet-RS模型和权重。 添加CoaT模型和权重。 感谢 为TResNet,MobileNet-V3,ViT模型添加新的ImageNet-21k权重和微调的权重。 谢谢 添加GhostNet模型和权重。 谢 更新ByoaNet注意模型 改进SA模块的初始化 将基于实验的独立Swin attn模块和swinnet 实验的一致“ 26t”模型定义。 添加改进的
2021-11-16 15:52:37 14.12MB pytorch resnet pretrained-models mixnet
1
低光图像增强 基于以下论文,通过光照图估计实现两种低光图像增强技术的 Python 实现: 稳健曝光校正的双光照估计 [] LIME:通过照明图估计进行低光图像增强 [] 这两种方法都基于 retinex 建模,旨在通过保留图像的突出结构来估计光照图,同时去除多余的纹理细节。 为此,两篇论文都使用了相同的优化公式(参见参考资料)。 与第二篇论文(以下称为 LIME)相比,第一篇论文(以下称为 DUAL)引入的新颖性在于对原始图像及其倒置版本的该映射的估计,它允许校正曝光不足和过度曝光图像的暴露部分。 此存储库中实现的代码允许使用这两种方法,可以从脚本参数中轻松选择。 安装 这个实现在python>=3.7上运行,使用pip安装依赖: pip3 install -r requirements.txt 用法 使用demo.py脚本来增强您的图像。 usage: demo.py
2021-11-16 10:49:01 1.38MB python3 lime retinex low-light-image
1
seamcarver:具有GUI的Seam Carver算法
1
颜色分类leetcode 使用 GAN 进行图像着色 介绍 该存储库是 Conditional GAN 的实现,用于将图像从灰度转换为 RGB。 网络的输入是 1 通道灰度图像(特别是 LAB 色彩空间的“L”通道),生成器将创建输入图像的 3 通道彩色版本。 生成器具有编码器-解码器架构; 鉴别器只是一个编码器加上提供一类输出的全连接层。 跳过连接应用于生成器(U-Net)。 对于 224x224 图像,生成器的架构如下所示。 每个块包含 Conv(transpose Conv) 层、BatchNormalization 和 Leaky ReLU。 生成器的最终激活函数是 tanh; 用于鉴别器的 sigmoid。 输入图像在输入网络之前被标准化。 总的来说,Conditional GAN 的目标函数是: 对于生成器,使用 L1 距离添加正则化项: 其中使用系数 lambda 100。 该模型使用 Adam 优化器进行了优化,并稍作改动。 该模型适用于各种彩色图像数据集。 这里实验了三个数据集:OxFlower、SpongeBob 和 SC2Replay。 :Oxford VGG g
2021-11-15 21:15:03 38.11MB 系统开源
1
分解信号重构Matlab代码子带图像压缩编码器 CPE 462图像处理和编码入门课程的最终项目,需要一个小组来开发涉及图像处理主题的应用程序,其中包括: 压缩,增强,分割,恢复或3D数据成像。 项目背景 在最近几年中,子带(或小波)图像编码技术变得非常流行。 一个主要原因是,在大多数情况下,它明显优于当前的JPEG图像编码标准。 实际上,基于子带的编码算法将成为下一代JPEG2000图像编码的基准。 项目实施 在这个项目中,我们在一个Matlab脚本中实现了一个子带图像编码器。 我们的脚本对典型的输入图像执行子带分解,标量量化和熵编码,并生成存储为数据文件的编码位流。 然后,解码器读取此编码文件,并执行熵解码和子带重构,最后生成与输入图像格式相同的重构图像。 它还计算重建图像的峰信噪比,以评估图像编码器的性能。 该脚本采用一个控制量化步长的输入,该参数最终将用于控制编码数据文件的大小(或压缩率)。 文件分解 subband_encoding_decoding.m -Matlab脚本,它接收单个.png并生成一个名为“ binary.txt”的比特流数据文件,以及从比特流数据文件中重建出
2021-11-15 14:37:37 2.04MB 系统开源
1
头部动作图像数据库 HeadPoseImageDatabase头部动作图像数据库 HeadPoseImageDatabase头部动作图像数据库 HeadPoseImageDatabase
2021-11-15 14:21:45 27.19MB dataset head pose image
1
AutoBlur_CNN_Features 基于以下代码: : 脚本,用于提取具有不同ConvNet的CNN深度特征,然后将其用于具有线性核的SVM分类器的图像分类任务,涉及以下小型数据集:足球[1],飞鸟[2],17flowers [3],ImageNet-6Weapons [4]和ImageNet-7节肢动物[4]。 使用VGG16提取的功能或MobileNet进入SVM分类器。 允许比较使用完整图像或使用AutoBlur方法过滤之间的差异 随代码一起提供了Soccer数据集,因此可以轻松对其进行测试: 足球:原始图像 SoccerAutoBlurBB:应用AutoBlur过滤技术并使用相应的边界框裁剪后的原始图像 参考: [1]范德·韦耶尔(J. van de Weijer),施密德(C. Schmid),着色局部特征提取,Proc.Natl.Acad.Sci.USA。
1
这个项目是迭代反投影(IBP)的一个简单实现解决超分辨率问题的算法。 它首先被提出作者:Michal Irani 在她 1991 年的论文“通过图像提高分辨率注册”。正在使用的成像模型由一篇论文描述Michael Elad,“图像的超分辨率重建”。 两篇论文可以通过 Google Scholar 中的搜索轻松找到。 我对成像模型做了两个简化: 1) 假设图像模糊是空间不变的。 2)空间变换模型是全局变换。 要运行示例代码,请执行以下步骤: 1) 运行 SRSetup.m 2)运行SRExample.m 示例代码对合成生成的数据集进行操作参考图像。 因此,模糊西格玛的确切值和正在使用平移偏移量。
2021-11-14 13:12:51 37KB matlab
1
这是关于图像与音频分割的电子书,高清,最新版本,经典著作,英文版
2021-11-14 12:17:52 18.44MB Image
1
PyTorch图像模型 赞助商 非常感谢我的的支持! 除了以上链接的赞助商之外,我还从以下位置获得了硬件和/或云资源: 英伟达( ) TFRC( ) 我很幸运能够自己投入大量时间和金钱来支持这个项目和其他开源项目。 但是,随着项目范围的扩大,需要外部支持来继续当前的硬件,基础设施和电力成本轨迹。 什么是新的 2021年5月5日 从添加MLP-Mixer模型和端口预训练权重 从添加CaiT模型和预训练权重 从添加ResNet-RS模型和权重。 添加CoaT模型和权重。 感谢 为TResNet,MobileNet-V3,ViT模型添加新的ImageNet-21k权重和微调的权重。 谢谢 添加GhostNet模型和权重。 谢 更新ByoaNet注意模型 改进SA模块的初始化 将基于实验的独立Swin attn模块和swinnet 实验的一致“ 26t”模型定义。 添加改进的E
2021-11-14 12:09:56 14.12MB pytorch resnet pretrained-models mixnet
1