定位相关的Tacotron 的PyTorch实现。 音频样本可以在找到。 可以在找到Colab演示。 图1: Tacotron(具有动态卷积注意)。 图2:示例梅尔谱图和注意图。 快速开始 确保您已安装Python 3.6和PyTorch 1.7或更高版本。 然后安装此软件包(以及): pip install tacotron univoc 用法示例 import torch import soundfile as sf from univoc import Vocoder from tacotron import load_cmudict , text_to_id , Tacotron # download pretrained weights for the vocoder (and optionally move to GPU) vocoder = Vocoder .
2022-05-18 18:11:43 1021KB text-to-speech pytorch tts speech-synthesis
1
U-Net理论课进阶、注意力机制、教程
1
空对地环境下成像视角单一,且需要依靠深层网络提供强特征表达能力。针对深层网络存在的计算量大、收敛速度慢等问题,在稠密连接网络(DenseNet)框架下,提出了一种用通道差异化表示的目标检测网络模型。首先,用DenseNet作为特征提取网络,并用较少的参数加深网络,以提高网络对目标的提取能力;其次,引入通道注意力机制,使网络更关注特征层中的有效特征通道,重新调整特征图;最后,用空对地目标检测数据进行了对比实验。结果表明,改进模型的平均精度均值比基于视觉几何组(VGG16)的单步多框检测算法高3.44个百分点。
2022-05-12 16:32:38 5.77MB 图像处理 目标检测 特征提取 通道注意
1
本系统通过目标检测算法使得系统可以通过图片识别一个或多个垃圾并对其进行分类,相较于传统的图片分类算法,允许用户同时识别多种垃圾;通过基于深度学习算法的文本分析使得系统能够充分理解各种物体名称的具体含义,以便于通过用户输入的名称对垃圾种类进行分类。 二、系统说明 2.1 功能介绍 图片垃圾分类:系统能够对图片中的多个物体进行检测并进行垃圾分类,最终返回待分类垃圾的物体名称以及其所属的垃圾类别。 文本垃圾分类:系统在对接收到的文本进行检测后,会返回待分类垃圾所属的垃圾类别。 2.2 数据介绍 图片数据集:图片识别类来自2019华为云垃圾分类挑战赛、爬虫搜集,共两万余张图片,91类物体;目标检测类为COCO数据集。 文本数据集:爬虫搜集,共3000类物体名称(其中有相似的,例如电池和干电池) 由于数据集过大,因此不会上传,如有需要可以在issue中提出。 2.3. 模型介绍(v1.0版本) 目标检测模型使用谷歌Object-Detection中的SSD模型、图片识别模型使用Inception-Resnet-v2模型。 文本分类模型使用两层双向LSTM与两层一维卷积模型,其中词向量层使用了
2022-05-09 11:04:27 77.94MB python
hsi matlab代码SAR_CD_MS_CapsNet 论文“”的代码,IEEE地质科学与遥感通讯,第1卷。 18号3,第484-488页,2021年3月。 如有任何疑问,请随时与我联系()。可以从以下网址获取更多代码 通过以下过程运行此代码: 差异图像可以通过邻域比率“ DI_generation.m”来获得。 (Matlab 2012a) 打开终端并运行以下脚本:“ python Ms_CapsNet.py”。 (Ubuntu-16.04.1 Keras-2.1.6) 在我们的实现中,我们引用郭锡峰和陈玉诗的代码:
2022-05-08 17:04:39 1.94MB 系统开源
1
利用深度学习模型的注意力机制 对LaTex公式进行识别,本项目利用的是tensorflow 可以快速识别图片的latex公式,可以免除打LaTex公式太烦等 包括以下部分 1. 搭建环境 Linux Mac 2. 开始训练 生成小数据集、训练、评价 生成完整数据集、训练、评价 3. 可视化 可视化训练过程 可视化预测过程 4. 评价 5. 模型的具体实现细节 总述 数据获取和数据处理 模型构建 6. 踩坑记录 win10 用 GPU 加速训练 如何可视化Attention层
2022-05-07 21:05:49 44.46MB 文档资料 LaTex OCR 自注意力机制
基于注意力机制和特征融合改进的小目标检测算法
2022-05-06 20:05:16 3.86MB 目标检测 算法 综合资源 人工智能
回归预测 | MATLAB实现Attention-LSTM(注意力机制长短期记忆神经网络)多输入单输出(完整源码和数据) 多输入单输出,运行环境MATLAB2020b及以上。
人工智能-项目实践-情感分析-基于LSTM网络与自注意力机制对中文评论进行细粒度情感分析 题目介绍 该题目为《细粒度用户评论情感分析》,来源于“全球AI挑战赛”。https://challenger.ai/competition/fsauor2018 对于题目内容以及任务描述均可从该网站获取,这里不再赘述。 成绩 单个模型最好的F1指标为:75.04 整体20个模型的综合F1指标为:68 数据集 数据集由比赛平台提供。包含105000条训练样本以及15000条测试样本。 关于数据集的标注可以点击这里查看。
采用注意力机制实现的中文聊天机器人(已上传模型,可直接运行).zip 大学生课程设计 基于机器学习的课程设计 自己大二写的课程设计
2022-04-22 18:05:09 58.86MB 机器学习