时空分割 该存储库包含的随附代码 。 变更记录 2020-05-19自提交以来,最新的Minkowski引擎不需要明确的缓存清除,并且可以更有效地使用内存。 2020-05-04:正如Thomas Chaton在上指出的那样,我还发现训练脚本包含一些错误,这些错误使模型无法达到使用最新MinkowskiEngine的Model Zoo中描述的目标性能。 我正在调试错误,但是发现错误有些困难。 因此,我从另一个私有创建了另一个git repo ,该达到了目标性能。 请参阅以获得ScanNet培训。 一旦发现错误,我将更新此存储库,并将SpatioTemporalSegmentation-ScanNet与该存储库合并。 抱歉,添麻烦了。 要求 Ubuntu 14.04或更高版本 CUDA 10.1或更高版本 pytorch 1.3或更高版本 python 3.6或更高版本 GCC 6或更高 安装 您需要通过pip或anaconda安装pytorch和 。 点子 MinkowskiEngine通过分发,可以通过pip进行简单安装。 首先,按照安装pytorch。 接下来,安装openbl
1
为了提高遥感图像语义分割的效果和分类精度,设计了一种结合ResNet18网络预训练模型的双通道图像特征提取网络。将多重图像特征图进行拼接,融合后的特征图具有更强的特征表达能力。同时,采用批标准化层和带有位置索引的最大池化方法进一步优化网络结构,提升地表目标物的分类准确率。通过实验,将所提方法与多种神经网络方法进行准确率和Kappa系数比较。结果显示,所提的网络结构可以在小数据量样本下取得90.68%的总体准确率,Kappa系数达到了0.8595。相比其他方法,所提算法取得了更好的语义分割效果,并且整体训练时间大幅缩短。
2021-11-25 14:49:30 20.86MB 图像处理 全卷积神 语义分割 双通道网
1
RoboSat是一个用Python 3编写的端到端管道,用于从航空和卫星图像中提取特征。 特征可以是图像中视觉上可区分的任何内容,例如:建筑物,停车场,道路或汽车。
2021-11-23 21:35:20 1.16MB Python开发-机器学习
1
为了说明训练过程,本示例将训练SegNet,一种用于图像语义分割的卷积神经网络 (CNN)。用于语义分割的其他类型网络包括全卷积网络(FCN)和U-Net。以下所示训练过程也可应用于这些网络。 本示例使用来自剑桥大学的CamVid数据集展开训练。此数据集是包含驾驶时所获得的街道级视图的图像集合。该数据集为 32种语义类提供了像素级标签,包括车辆、行人和道路。 本示例创建了SegNet网络,其权
2021-11-21 16:37:11 1.06MB 使用MATLAB深度学习进行语义分割
1
CCNet-Pure-Pytorch 用于纯Pytorch中语义分割的Criss-Cross Attention(2d&3d),具有更快,更精确的实现方式。 更新 **** 2021/03:纯pytorch实现3D CCNET模块的三种被释放 。 您可以在和检查其正确性 介绍 我非正式地重新实现了纯Pytorch中的以便在不同版本和环境下实现更好的兼容性。 以前的许多开源项目都在Pytorch上使用了Cuda扩展,因此存在兼容性和精度损失的问题。 此外,当我们设置cudnn.benchmark = True时,Pytorch可能无法优化和加速Cuda扩展。 为了解决这些问题,我基于的张量变换在CC.py中设计了一个Criss-Cross Attention操作,该操作并行执行,并且在向前结果和向后渐变中显示出更快的速度和更精确的效果。 我的运作和表现 不需要CUDA扩展。 以前的“ Cr
2021-11-18 14:16:15 3.96MB tensorflow pytorch attention ccnet
1
快速语义分割 该存储库旨在为PyTorch中的移动设备提供准确的实时语义分段代码,并在Cityscapes上提供预训练的权重。 这可用于在各种现实世界的街道图像上进行有效的分割,包括Mapillary Vistas,KITTI和CamVid等数据集。 from fastseg import MobileV3Large model = MobileV3Large . from_pretrained (). cuda (). eval () model . predict ( images ) 这些模型是MobileNetV3 (大型和小型变体)的实现,具有基于LR- ASPP的修改后的细分头。 顶级型号在Cityscapes val上能够达到72.3%的mIoU精度,而在GPU上以高达37.3 FPS的速度运行。 请参阅下面的详细基准。 当前,您可以执行以下操作: 加载预训练的Mo
1
unet unet主要用于语义分割, 这里是一个细胞边缘检测的例子, 数据集比较简单。 unet的网络结构, 因像字母‘U’而得名。 这里有一篇关于unet的 [论文](U-Net: Convolutional Networks for Biomedical Image Segmentation), 论文里面的网络结构如下: 说一下这个网络: 输入572×572×1, 输出:388×388×2, 大小不一样。 主要是因为卷积的过程中, 每次卷积会减小, 在copy and crop中, 也会减小。 我这里设计的网络, 并没有像上图的网络一样, 原封不动的实现出来, 而是借助vgg网络结构来实现的。 看上图, 我们发现, unet的前半部分采用2层卷积+一层池化的设计方式, 这一点和vgg16的前半部分很相似, 因此, 我在实现的过程中, 采用了vgg16的前10层。 网络设计 def vg
2021-11-18 09:37:47 13.13MB keras unet Python
1
pytorch-3dunet PyTorch实施3D U-Net及其变体: 基于3D U-Net的标准3D U-Net ÖzgünÇiçek等人。 基于残差3D U-Net。 该代码允许对U-Net进行以下方面的训练:语义分割(二进制和多类)和回归问题(例如降噪,学习解卷积)。 二维U网 也可以训练标准2D U-Net,有关示例配置,请参见 。 只需确保将单例z维保留在H5数据集中(即(1, Y, X)而不是(Y, X) ),因为数据加载/数据扩充始终需要3级张量。 先决条件 Linux NVIDIA GPU CUDA CuDNN 在Windows上运行 该软件包尚未在Windows上进行过测试,但是有报告称该软件包已在Windows上使用。 要记住的一件事:在使用CrossEntropyLoss进行训练时:配置文件中的标签类型应该从long更改为int64 ,否则会出现错误:
2021-11-16 15:48:36 30.49MB pytorch unet semantic-segmentation volumetric-data
1
“语义分割”处理的是像素级分类问题,是计算机视觉中的基本任务,在自动驾驶、地物检测以及医疗辅助等许多领域,有着巨大的应用价值。常见的基于深度神经网络的语义分割模型,有U-Net,SegNet,PSPNet,以及DeepLab系列,(含论文出处和代码链接)。后续还将进一步整理完善哟!
2021-11-15 22:42:09 2.27MB Semantic segment U-net SegNet
1
移动网 移动U-NET语义分割。 使用process_video文件每帧运行约40毫秒
1