1、项目要求: ​基于 pytorch 搭建神经网络分类模型识别花的种类,输入一张花的照片,输出显示最有可能的前八种花的名称和该种花的照片。 2、分三大步骤操作: 数据集预处理操作: 读取数据集数据 构建神经网络的数据集 1)数据增强:torchvision中transforms模块自带功能,将数据集中照片进行旋转、翻折、放大…得到更多的数据 2)数据预处理:torchvision中transforms也帮我们实现好了,直接调用即可 3)处理好的数据集保存在DataLoader模块中,可直接读取batch数据 网络模型训练操作: 迁移pytorch官网中models提供的resnet模型,torchvision中有很多经典网络架构,调用起来十分方便,并且可以用人家训练好的权重参数来继续训练,也就是所谓的迁移学习 选择GPU计算、选择训练哪些层、优化器设置、损失函数设置… 训练全连接层...... 详细介绍见:https://blog.csdn.net/zhaohaobingniu/article/details/119922606?spm=1001.2014.3001.5501
2022-05-07 17:47:42 758.2MB pytorch python 神经网络 深度学习
1
https://s3.us-west-1.wasabisys.com/resnest/torch/resnest50-528c19ca.pth模型下载
2022-05-07 17:21:21 105.16MB pytorch
1
基于Pytorch实现的EcapaTdnn声纹识别大模型(spectrogram),这个模型使用的声谱图(spectrogram) 源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-Pytorch
2022-05-07 12:05:37 54.73MB 声纹识别 pytorch 人工智能 声谱图
深度情感:使用注意卷积网络的面部表情识别 这是研究论文“的PyTorch实现 [注意]这不是官方执行文件 建筑学 基于注意力卷积网络的端到端深度学习框架 通过空间变压器网络添加注意机制 数据集 先决条件 要运行此代码,您需要具有以下库: 火炬> = 1.1.0 火炬视觉== 0.5.0 OpenCV tqdm 皮尔 该存储库的结构 该存储库的组织方式为: 此文件包含数据集和训练循环的设置。 此文件包含用于评估测试数据模型和网络摄像头实时测试的源代码。 此文件包含模型类 此文件包含数据集类 此文件包含数据集的设置 用法 DeepLearning_by_PhDScholar创建的超酷视频,介绍如何使用此实现。 资料准备 从Kaggle下载数据集,然后将train.csv和test.csv解压缩到./data文件夹中。 怎么跑 设置数据集 python main.py [-s
2022-05-07 11:53:19 137KB Python
1
神经网络 基于神经网络的歌声合成库进行研究。 演示版 使用kiritan_singing数据库的基于神经网络的歌声合成演示(日语) 音频样本 Kiritan示例: ://soundcloud.com/r9y9/sets/dnn-based-singing-voice 安装 Python 3.6或更高版本 :需要开发版本(master分支) 开发版本。请查看安装的邮局。 火炬> = 1.x 请注意,上面列出的软件包应手动安装。安装它们后,您可以运行: python setup.py develop 安装其余的依赖项。 储存库结构 核心程式库: 命令行程序: 及其配置 食谱: Python docstring样式 菜谱 配方是用于重现实验的一组脚本和配置。用于进行实验的所有步骤均以独立方式提供。如果要构建唱歌语音系统,请查看目录。 背景 截至2020年2月,基于DNN的歌声合成工具在日
2022-05-07 00:33:30 208KB python dnn pytorch singing-voice
1
Retinanet:目标检测模型在Pytorch当中的实现 目录 性能情况 训练数据集 权值文件名称 测试数据集 输入图片大小 mAP 0.5:0.95 mAP 0.5 VOC07+12 VOC-Test07 600x600 - 81.56 所需环境 torch==1.2.0 文件下载 训练所需的retinanet_resnet50.pth可以在百度云下载。 链接: 提取码: krr5 VOC数据集下载地址如下: VOC2007+2012训练集 链接: 提取码: eiw9 VOC2007测试集 链接: 提取码: dsda 预测步骤 a、使用预训练权重 下载完库后解压,在百度网盘下载retinanet_resnet50.pth,放入model_data,运行predict.py,输入 img/street.jpg 利用video.py可进行摄像头检测。 b、使用自己训练的权重 按照训练
2022-05-06 22:45:27 5.31MB 附件源码 文章源码
1
热释电 Tacotron的PyTorch实现,以及利用Wavenet实现PyTorch实现。 特征 在和之间轻松切换 使用json进行详细的模型结构配置 对于Tacotron: 对于Tacotron2: 分行 可以通过合并以下不同分支中的功能来创建新配置。 硕士:基本的Tacotron和Tacotron2实施 dynamic_r :动态减少因子(r)随训练时间表而变化 gst :全局样式令牌(GST)支持 多扬声器:具有扬声器嵌入功能的多扬声器支持 设置 准备DATASET目录 准备train.csv.txt和val.csv.txt文件 将中的training_files和validation_files分别更改为上述两个文件 对files_to_list进行必要的修改,以在检索“ mel_file_path”和“ text” 安装PyTorch 安装python要求或构建do
2022-05-06 22:20:18 31KB pytorch gst tacotron gst-tacotron
1
Pytorch实现我们的CIFAR10的图像分类 模型有LeNet,AlexNet,VGG,GoogLeNet,ResNet,DenseNet,Efficientnet,MobileNet,MobileNetv2,ResNeXt,Pnasnet,RegNet,SeNet,ShuffleNet,ShuffleNetv2,Preact_ResNet,DPN,DLA 在models中有所有模型的实现,然后在main.py中定义了训练的代码,也可以进行预测我们的结果,除此之外,对所有的模型自己进行了测试,并且对准确率做了一个详细的比较,也可以根据此进行测试和比较训练。 在资源中有全部代码的学习资料,代码所有都可运行,可执行,可复现
2022-05-06 20:05:10 24KB python pytorch 人工智能 图像分类
利用GAN的思想,进行数字对抗样本生成,以LeNet作为图像分类模型,LeNet是一个小型的神经网络结构,仅包含两层卷积层、两个池化层以及三层全连接。该轻量级网络能快速、占内存小、高精确度的解决复杂度比较低的问题,如手写数字识别。 (步骤1)用LeNet网络完成手写数字识别任务。 (步骤2)利用对抗样本工具包生成针对该网络的对抗样本。 整体包括一下部分 步骤1:用`LeNet网络`完成手写数字识别任务。 LeNet 网络 数据集的下载和预处理 Image displaying pytorch 搭建LeNet LetNet 训练 超参数的设置 训练及测试模型 可视化误差曲线,准确率曲线 结果可视化,查看每一类的准确率 模型的保存与加载 步骤2:生成针对该网络的对抗样本。 威胁模型 快速梯度符号攻击 定义扰动上限 epsilons 被攻击的模型 FGSM 攻击方式 测试函数 启动攻击 对抗结果 准确性 vs Epsilon 样本对抗性示例
2022-05-06 20:05:10 714KB pytorch 人工智能 python 深度学习
我就废话不多说了,直接上代码吧! import torch import torch.nn.functional as F import numpy as np from torch.autograd import Variable ''' pytorch实现focal loss的两种方式(现在讨论的是基于分割任务) 在计算损失函数的过程中考虑到类别不平衡的问题,假设加上背景类别共有6个类别 ''' def compute_class_weights(histogram): classWeights = np.ones(6, dtype=np.float32) normHist =
2022-05-06 18:55:55 49KB al c cal
1