深度包 博客文章中的详细信息: : 如何使用 克隆项目 下载我在创建的训练和测试集,或者如果您想从头开始处理数据,请下载。 使用docker镜像运行python代码: docker run -it \ -v /path/to/the/code:/data \ mhwong2007/deep_packet \ bash 如果要运行Jupyter笔记本,请使用以下命令: docker run -it \ -v /path/to/the/code:/data \ -p 8888:8888 \ mhwong2007/deep_packet \ jupyter lab --no-browser --ip=0.0.0.0 --port=8888 --NotebookApp.token= ' ' --allow-root 如果要自己构建环境,请在安装依赖项和库 数据预处理 python pr
2023-05-10 22:39:16 572KB deep-learning cnn pytorch traffic-classification
1
图片字幕 介绍 建立一个模型以从图像生成字幕。 给定图像后,模型可以用英语描述图像中的内容。 为了实现这一点,我们的模型由一个编码器(一个CNN)和一个解码器(一个RNN)组成。 为CNN编码器提供了用于分类任务的图像,其输出被馈送到RNN解码器,后者输出英语句子。 该模型及其超参数的调整基于论文和。 我们使用微软Çommon在CO NTEXT(MS COCO)O bjects为这个项目。 它是用于场景理解的大规模数据集。 该数据集通常用于训练和基准化对象检测,分段和字幕算法。 有关下载数据的说明,请参见下面的“数据”部分。 代码 该代码可以分为两类: 笔记本-该项目的主要代码由一系列Jupyter笔记本构成: 0_Dataset.ipynb介绍数据集并绘制一些样本图像。 1_Preliminaries.ipynb加载和预处理数据并使用模型进行实验。 2_Training.ip
2023-01-02 13:00:14 2.09MB nlp computer-vision cnn pytorch
1
pytorch实现cnn手写识别
2022-05-17 17:08:40 1.74MB cnn pytorch 源码软件 人工智能
1
超快速通道检测 PyTorch实施的论文“”。 更新:我们的论文已被ECCV2020接受。 评估代码是从改性和。 Caffe模型和原型可以在找到。 演示版 安装 请参阅 开始吧 首先,请根据您的环境在configs/culane.py或configs/tusimple.py配置中修改data_root和log_path 。 data_root是您的CULane数据集或Tusimple数据集的路径。 log_path是tensorboard日志,训练有素的模型和代码备份的存储位置。它应该放置在该项目之外。 对于单GPU训练,运行 python train.py configs/path_to_your_config 对于多GPU训练,请运行 sh launch_training.sh 或者 python -m torch.distributed.launch --nproc_per_n
2022-03-20 10:49:55 152KB cnn pytorch lane-finding autonomous-driving
1
此数据集包含了100个汉字的图片见,每个汉字都标上了数字标签,具体的使用可参考博客中的代码(手写汉字的分类识别)
2022-03-03 20:39:54 98.23MB 汉字图片集 CNN Pytorch
1
植物病害检测仪 由和创建 我在中的 在经过预处理的数据集上训练模型,可以在下载。 本地设置 当地的: 建议在虚拟环境中设置项目,以保持依赖关系分离。 激活您的虚拟环境。 通过运行pip install -r requirements.txt安装依赖项。 通过运行python app/server.py serve启动服务器。 访问进行探索和测试。 码头工人: 确保Docker已安装在您的本地计算机中。 了解如何安装Docker 。 苹果电脑: $ git clone https://github.com/imskr/Plant_Disease_Detection.git $ cd Plant_Disease_Detection $ docker build -t fastai-v3 . $ docker run --rm -it -p 8080:8080 fastai-v3
2021-11-26 11:47:25 88.29MB cnn pytorch machinelearning deeplearning
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
使用深度学习进行图像伪造 使用深度学习的图像伪造检测,在PyTorch中实现。 提议 整个框架:首先,将RGB图像分为重叠的块(64x64)。 然后,在被网络打分之前,将RGB色块转换为YCrCb颜色通道。 最后,设计了一个后期处理阶段,以完善网络的预测,并就图像的身份验证做出最终结论。 深度神经网络改编自MobileNet-V2。 但是,我们修改了原始MobileNet-V2,使其与我们的问题更加相关。 下图描述了体系结构修改。 实验结果 我们已经对模型配置进行了全面评估,以显示哪个因素可以改善模型的最终性能。 为了解决这个问题,我们定义了与MobileNetV2(称为MBN2)一起作为核心的六种配置。 要考虑两个颜色通道,即RGB和YCrCb。 此外,还考虑了三种MobileNetV2架构进行比较。 第一个体系结构是从零开始训练的MobileNetV2,第二个体系结构是通过Image
2021-10-21 23:11:40 121.31MB cnn pytorch deeplearning mobilenetv2
1
带火炬的自动编码器去噪 众所周知,我们从相机拍摄的照片有时不适合处理。 在该项目中,在执行诸如文本检测之类的项目时,采取了必要的步骤以实现最大的效率。 此步骤是清除图像中的噪点。 在这个项目中使用了卷积神经网络和自动编码器。 玩的很开心。 嘈杂的图片和清晰的图片 结果
2021-09-30 14:05:20 6.77MB python image denoising-autoencoders cnn-pytorch
1
SRGAN-PyTorch 该资源库包含在纸上的非官方pyTorch实施SRGAN也SRResNet的,CVPR17。 我们密切关注原始SRGAN和SRResNet的网络结构,培训策略和培训设置。 我们还CVPR16将子像素卷积层实现为。 也分享了对该存储库的贡献。 许可和引文 所有代码和其他材料(包括但不限于表格)仅用于学术研究目的,不提供任何担保。 任何商业用途都需要我们的同意。 如果我们的工作对您的研究有所帮助,或者您在研究中使用了代码的任何部分,请适当确认: @InProceedings{ledigsrgan17,    author = {Christian Ledig and Lucas Theis and Ferenc Huszár and Jose Caballero and Andrew Cunningham and Alejandro Acosta and
2021-09-14 16:58:28 1.37MB cnn pytorch super-resolution srgan
1