解开变分自编码器 PyTorch 实现的论文 团队成员: 安德烈亚斯·斯帕诺普洛斯 ( ) Demetrios Konstantinidis ( ) 存储库结构 目录包含我们迄今为止创建的模型。 一路上还会有更多。 python脚本是主要的可执行文件。 目录包含可用于训练和测试的 colab notebook。 在目录中有一个 ,其中详细解释了变分自动编码器的基本数学概念。 在目录中有一些配置文件可用于创建模型。 在目录中有我们通过使用各种配置运行模型得到的结果。 楷模 目前支持两种模型,一个简单的变分自动编码器和一个解开版本 (beta-VAE)。 模型实现可以在目录中找到。 这些模型是使用PyTorch Lightning开发的。 变分自编码器 变分自编码器是一个生成模型。 它的目标是学习数据集的分布,然后从相同的分布中生成新的(看不见的)数据点。 在下图中,我们可
1
研究@ Magic Leap(CVPR 2020,口腔) SuperGlue推理和评估演示脚本 介绍 SuperGlue是在Magic Leap完成的2020 CVPR研究项目。 SuperGlue网络是一个图形神经网络,结合了最佳匹配层,该层经过训练可以对两组稀疏图像特征进行匹配。 此存储库包含PyTorch代码和预训练权重,用于在关键点和描述符之上运行SuperGlue匹配网络。 给定一对图像,您可以使用此存储库在整个图像对中提取匹配特征。 SuperGlue充当“中端”,在单个端到端体系结构中执行上下文聚合,匹配和过滤。 有关更多详细信息,请参见: 全文:PDF: 。 作者: Pa
1
服务器上的YOLO 此存储库包含在服务器即服务上运行检测算法的代码,并且具有我的方法的实时实现。 自由使用它:) 强烈建议启动并运行Tensorflow-gpu。 在目录内移动之后。 运行项目: 安装虚拟环境 pip install virtualenv 启动虚拟环境 virtualenv venv 激活virtualenv . venv/bin/activate 安装要求 pip install -r requirements.txt 下载并转换yolov3和yolov3-tiny的权重 wget https://pjreddie.com/media/files/yolov3.weights ./yad2k.py yolov3.cfg yolov3.weights yolo.h5 wget https://pjreddie.com/media/files/yol
1
通过卷积神经网络学习人机交互 在我在东京大学的研究实习期间保存所做工作的资料库。 日本农业技术研究院。 这项研究是关于使用卷积神经网络(CNN)通过从力传感器中学习数据模式来对人类的几种触摸交互类型进行分类(p,划痕,轻击,硬压和中性)。 该传感器将人的触觉转换为3维力数据。 数据 每0.02秒(50 fps)使用pySerial获取数据。 十个人每次对传感器进行30次触摸交互并记录数据。 从数据统计数据中推断出一个合适的阈值,以区分噪声中的正信号和一个正事件(样本)的合适数量的帧。 通过将每个数据样本内插到40帧并对它们进行归一化以减少零偏噪声的影响,对数据进行预处理。 由于该数据集属于实验室中的个人,因此此处未共享。 即将完成涵盖受试者身份以保护其隐私的过程,然后将发布数据集。 该模型 使用Python中的Keras框架使用数据训练了CNN模型。 Adam优化器用于lr = 1
1
PyTorch + Catalyst实现的“ 。 该存储库处理培训过程。 为了进行推断,请检出GUI包装器:PyQT中的 。 该储存库已与合并为。 目录 要求 计算方式 我们在1050 Mobile和Tesla V100的两个GPU上运行了该程序。 我们没有进行任何基准测试,但是V100的速度大约提高了400倍。 它还取决于您下载的数据量。 因此,任何服务器级GPU都是可行的。 贮存 该程序确实会生成很多文件(下载和其他方式)。 每个音频文件的大小为96kiB。 对于7k独特的音频剪辑,并以70/30的比例进行火车和验证拆分,它占用了约120GiB的存储空间。 因此,如果您下载更多音频片段,则至少为1TB 。 记忆 至少需要4GB VRAM 。 它可以处理2个批处理大小。在20个批处理大小下,在两个GPU上,每个GPU占用16GiB VRAM。 设置 如果您使用的是Docker,则
1
OmniNet:用于多模式多任务学习的统一架构 OmniNet是用于多模式多任务学习的Transformer体系结构的统一和扩展版本。 单个OmniNet体系结构可以对几乎任何现实领域(文本,图像,视频)的多个输入进行编码,并能够跨多种任务进行异步多任务学习。 OmniNet体系结构包含多个称为神经外围设备的子网,用于将特定于域的输入编码为时空表示形式,并连接到称为中央神经处理器(CNP)的通用中央神经网络。 CNP实现了基于变压器的通用时空编码器和多任务解码器。 该存储库包含用于的官方Pytorch实施(Pramanik等)。 本文演示了OmniNet的一个实例,该实例经过联合训练以执行
2023-04-11 15:36:51 17.41MB nlp machine-learning deep-learning neural-network
1
PyRecognizer 一个简单的人脸识别引擎 火车/预测视频指南 模型为一些名人调整 以下列表包含名人的姓名和用于训练的照片数,按照片数排序 名人名单George_W_Bush 530 Colin_Powell 236 Tony_Blair 144 Donald_Rumsfeld 121 Gerhard_Schroeder 109 Ariel_Sharon 77 Hugo_Chavez 71 Junichiro_Koizumi 60 Jean_Chretien 55 John_Ashcroft 53 Serena_Williams 52 Jacques_Chira
2023-04-11 09:46:06 33.01MB photos neural-network rest-api facial-recognition
1
沃伦-股票价格预测器 股市预测是试图确定公司股票或在交易所交易的其他金融工具的未来价值的行为。 成功预测股票的未来价格可能会产生可观的利润。 有效市场假说表明,股票价格反映了所有当前可用的信息,因此,任何不基于新发现信息的价格变化本质上都是不可预测的。 其他人则不同意,并且拥有这种观点的人拥有无数的方法和技术,据称它们可以获取未来的价格信息。 在这里,我们利用Facebook的时间序列预测算法Prophet,使用多变量,单步预测策略,实时预测美国公司的股票市场价格。 入门 从github下载或克隆项目 $ git clone https://github.com/nityansuman/wa
2023-04-07 10:52:14 1.28MB python flask neural-networks stock-price-prediction
1
道路分割 合作者: 目录 : 介绍 该项目是 “模式分类和机器学习”课程的一部分。 更具体地说,这是我们针对道路分割的第二个项目的解决方案。 该文件概述了我们的代码及其功能。 有关该项目本身的所有其他说明,可以在其官方文件( paper.pdf文件)中找到。 该项目的目标是通过确定哪些16x16像素斑块是道路还是不是道路来分割地球的卫星图像。 简而言之,该代码运行第一个卷积神经网络以获得基本预测。 此后,它运行第二个,即后处理一个,它使用先前计算的预测来给出最终预测。 结果 我们取得了约0.91的F1分数,下面您将看到一个图像,说明所获得的定性结果。 在图像上,每个检测到的道路补丁都以
1
使用神经混合形状学习骨骼关节 这个存储库提供了一个端到端的库,用于自动角色绑定、蒙皮和混合形状生成,以及一个可视化工具。 它基于我们在 SIGGRAPH 2021 上发表的研究。 先决条件 我们的代码已经在 Ubuntu 18.04 上测试过。 在开始之前,请通过以下方式配置您的 Anaconda 环境 conda env create -f environment.yaml conda activate neural-blend-shapes 或者您可以手动安装以下软件包(及其依赖项): 火炬 1.8 张量板 tqdm 矮胖的 opencv-python 快速开始 我们提供了一个专用于 Biped 角色的预训练模型。 从或(9ras)下载并解压预训练模型,并将pre_trained文件夹放在项目目录下。 跑步 python demo.py --pose_file=./eval_
1