Context-Dependent Pre-trained Deep Neural Networks for Large Vocabulary Speech Recognition
2021-05-13 15:44:06 1.1MB Neural Networks
1
Tensorflow实现:图像描述---Show and Tell: A Neural Image Caption Generator-附件资源
2021-05-12 22:20:45 106B
1
involution.pytorch() 一个PyTorch实现使用过密的 对合的非官方pytorch实现。 官方实现可以在找到。 特征 该层可以处理任意输入和输出通道,内核大小,步幅和减速比。 但是,输入通道应按组划分。 要求 pytorch >= 1.4.0 einops >= 0.3.0 用法 一个例子: >>> import torch >>> from involution import Involution >>> >>> x = torch.rand(2,8,5,5) >>> i = Involution(in_channels=8, out_channels=4, groups=4, kernel_size=3, stride=2, reduction_ratio=2) >>> i(x).size () torch.Size([2, 4, 3, 3]) 去做 Ima
1
edit by ripley. university oxford
2021-05-11 14:49:19 47.75MB pattern recognition neural networks
1
ResneXt网络论文
2021-05-10 12:02:03 1.27MB ResneXt
1
模块化的、具有关系推理能力的深度神经网络架构 RN介绍,可以“即插即用”,提升其他深度神经网络结构(如 CNN)关系推理的能力。
2021-05-07 10:05:49 1.37MB AI DeepMind 关系推理 Relation
1
DeblurGAN DeblurGAN:使用条件对抗网络进行盲运动去模糊的Pytorch实现。 我们的网络将模糊的图像作为输入,并进行相应的清晰估计,如示例所示: 我们使用的模型是条件性Wasserstein GAN,具有基于VGG-19激活的渐变惩罚+感知损失。 这样的体系结构在其他图像到图像的转换问题(超分辨率,着色,修复,除雾等)上也给出了良好的结果。 怎么跑 先决条件 NVIDIA GPU + CUDA CuDNN(CPU未经测试,感谢反馈) 火炬 从下载权重。 请注意,在推论过程中,您仅需保持Generator权重。 放入砝码 /.checkpoints/experimen
2021-05-06 19:42:00 34.29MB computer-vision deep-learning neural-network paper
1
在PyTorch中检索CNN图像:在PyTorch中训练和评估CNN以进行图像检索 这是一个Python工具箱,用于实现对本文所述方法的培训和测试: 无需人工注释即可对CNN图像进行微调, RadenovićF.,Tolias G.,Chum O.,TPAMI 2018 [ ] CNN图像检索从BoW获悉:无监督的微调,并附有困难的示例, RadenovićF.,Tolias G.,Chum O.,ECCV 2016 [ ] 它是什么? 该代码实现: 训练(微调)CNN进行图像检索 学习CNN图像表示的监督美白 在牛津和巴黎数据集上测试CNN图像检索 先决条件 为了运行此工具箱,您将需要: Python3(在Debian 8.1上使用Python 3.7.0进行了测试) PyTorch深度学习框架(已通过1.0.0版测试) 其余所有(数据+网络)将通过我们的脚本自动下载
2021-05-06 10:42:15 41KB python cnn pytorch convolutional-neural-networks
1
网络视觉 NeAt(Neural Attention)Vision是一种可视化工具,用于自然语言处理(NLP)任务的深度学习模型的注意力机制。 产品特点 可视化注意力得分,有很多选择。 将可视化文件导出为SVG格式。 如果要在学术论文中使用可视化效果,这将非常方便。 但是,您可能必须将SVG转换为PDF。 可视化模型预测。 显示类的后验分布,回归任务中的错误等。 对于调试模型和检查其行为很有用。 支持分类,多标签分类和回归。 进行了整齐的可视化,以可视化自然语言处理(任务)任务的注意机制的权重。 目前,整洁的视觉只支持可视化的自我注意机制,在句子级别上执行以下任务: 回归:预测单个连
2021-05-04 19:04:07 13.58MB visualization nlp natural-language-processing vuejs
1
使用智能手机数据集和LSTM RNN的人类活动识别(HAR)。 将运动类型分为以下六类: 步行, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, 坐下 常设, 铺设。 与传统方法相比,使用具有长短期记忆单元(LSTM)的递归神经网络(RNN)不需要或几乎不需要特征工程。 数据可以直接馈入神经网络,就像黑盒子一样,对问题进行正确建模。 关于活动识别数据集的可以使用大量的特征工程,这是一种结合了经典数据科学技术的信号处理方法。 就数据预处理量而言,此处的方法非常简单。 让我们使用Google简洁的深度学习库TensorFlow演示LSTM的用法,LSTM是一种可以处理顺序数据/时间序列的人工神经网络。 视频数据集概述 点击此链接可观看其中一位参与者在实验中记录的6个活动的视频: 有关输入数据的详细信息 我将在数据上使用LSTM进行学习(作为连接在腰部的手机),以识别用户正在进行的活动类型。 数据集的描述如下: 传感器信号(加速度计和陀螺仪)通过应用噪声滤波器进行预处理,然后在2.56秒和50%重叠(128个读数/窗口)的固定宽度滑动窗口中采
1