希望网 Hopenet是一个准确且易于使用的头部姿势估计网络。 在300W-LP数据集上对模型进行了训练,并在具有良好定性性能的真实数据上进行了测试。 有关方法和定量结果的详细信息,请查看CVPR Workshop。 新的 新的 要使用,请安装和 (用于视频)-我相信,除了numpy之类的常用库之外,您只需要这些即可。 您需要一个GPU才能运行Hopenet(目前)。 要使用dlib人脸检测在视频上进行测试(头部中心会跳动): python code/test_on_video_dlib.py --snapshot PATH_OF_SNAPSHOT --face_model PATH
2021-12-13 10:42:21 13.75MB deep-neural-networks deep-learning head gaze
1
深度演示 概述 该存储库包含一些使用深度学习方法的示例,这些示例用于在MoveIt Task构造函数中掌握姿势的生成。 这些软件包是在运行ROS Melodic的Ubuntu 18.04上开发和测试的。 配套 :使用深度学习方法在MoveIt Task构造函数中的把握生成阶段构造一个拾取和放置任务 :使用Dex-Net从深度图像中采样抓取 moveit_task_constructor_gpd :使用GPD采样来自3D点云的抓取 入门 首先,完成“ 入门指南” 。 在安装依赖项之前,建议先运行: sudo apt update sudo apt upgrade 重要说明:建议在catkin工作区之外安装不是ROS软件包的依赖项。 对于GPD,这包括PCL,OpenCV和GPD库。 对于Dex-Net,这包括gqcnn , autolab_core ,悟性和可视化。 下面的步骤
1
DBCNN-Pytorch 使用深双线性卷积神经网络进行盲图像质量评估的实验性PyTorch实现。 目的 考虑到PyTorch在学术界的受欢迎程度,我们希望此回购协议可以帮助IQA的研究人员。 此存储库将用作集成IQA研究的先进技术的活动代码库。 要求 PyTorch 0.4+ Python 3.6 默认设置下的用法 python DBCNN.py 如果要重新训练SCNN,仍然需要Matlab和原始存储库来生成合成失真的图像。 python SCNN.py 引文 @article {zhang2020blind, title = {使用深双线性卷积神经网络进行盲图像质量评估}, 作者= {张维霞和马克德和闫家加邓,德祥和王舟}, journal = {IEEE视频技术电路和系统的交易}, 音量= {30}, 数字= {1}, 页数= {36--47}, 年= {2020} } 致谢
2021-12-11 11:28:44 4.59MB python deep-neural-networks deep-learning pytorch
1
语音情感分析器:神经网络模型能够从音频语音中检测出五种不同的男女情感。 (深度学习,NLP,Python)
1
[PYTORCH]用于文档分类的分层注意网络 介绍 下面是我的文件分层关注网络的文档分类描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56 49.66MB python nlp deep-neural-networks deep-learning
1
暹罗深度神经网络的语义相似性。 该存储库包含Tensorflow中的暹罗神经网络的实现,该实现基于3种不同的主要深度学习架构构建: 卷积神经网络 递归神经网络 多头注意力网络 创建该存储库的主要原因是将GitHub上主要基于CNN和RNN架构构建的Siamese神经网络的知名实现方案与基于Transformer模型最初由提出的基于多头注意力机制构建的Siamese神经网络进行比较,这论文。 。 支持的数据集 当前版本的管道支持使用3个数据集: :NEW_button: 对抗自然语言推论(ANLI)基准: , 安装 资料准备 为了下载数据,请执行以下命令(此过程可能需要一段时间,具体取决于您的网络吞吐量):
1
音频分类使用深度学习 使用深度学习对10种不同的城市声音进行分类。 可以从以下链接下载音频文件: : 重要说明:文件夹应按以下方式排列: 火车标签目录:sounds / labels / train.csv 测试标签的目录:sounds / labels / test.csv 火车声音的目录:sounds / train / train_sound /(。wav格式的音频文件) 火车声音的目录:sounds / test / test_sound /(。wav格式的音频文件) 火车文件夹贴有标签 测试文件夹未标记 我们将一个音频信号分成3个,以将数据实际加载为机器可理解的格式。 为此,我们只需要在每个特定的时间步长之后取值即可。 例如; 在2秒的音频文件中,我们将在半秒内提取值。 这称为音频数据采样,而对其采样的速率称为采样速率。 现在可以将不同的纯信号表示为频域中的三个唯
1
关于在英语语料库上进行词嵌入训练的研究很多。 该工具包通过在德语语料库上应用深度学习,以训练和评估德语模型。 有关项目,评估结果和的概述可在或直接在此存储库中找到。 该项目是根据发布的。 开始吧 确保已安装Python 3以及以下库: pip install gensim nltk matplotlib numpy scipy scikit-learn 现在,您可以下载并在您的Shell中执行它,以自动下载此工具包和相应的语料库文件并进行模型训练和评估。 请注意,这可能需要大量时间! 您也可以克隆此存储库,并使用我已经进行评估和可视化。 如果您只想查看不同Python脚本的工作方式,
1
深度微词典学习和编码网络(WACV 2019) | | 引文 如果您使用此代码进行研究,请引用我们的论文。 @article{tang2020dictionary, title={When Dictionary Learning Meets Deep Learning: Deep Dictionary Learning and Coding Network for Image Recognition With Limited Data.}, author={Tang, Hao and Liu, Hong and Xiao, Wei and Sebe, Nicu}, journal={IEEE TNNLS}, year={2020} } @inproceedings{tang2019multichannel, title={Deep Micro-Dictionary
1