挡风玻璃上的雨滴 我们提供一组公开可用的图像,用于训练和评估视觉算法在相机镜头或挡风玻璃上进行雨滴检测的不同任务的性能。 目前,它包含8190张图像,其中3390张包含雨滴。 数据集描述 数据集的图像是在移动过程中通过安装在车辆上的摄像头捕获的。 车辆的运动发生在市区和高速公路上,因此该数据集非常适合训练和评估视觉算法,以进行自动车辆摄像机镜头污染检测。 数据集表示包含8190张图像的视频帧序列,其中3390张包含雨滴。 通过用多边形勾勒出伪影来标记图像。 标记结果以JSON格式存储。 此外,还从该标记生成了二进制掩码,为方便起见,这些掩码也显示在数据集中。 白色表示伪影区域。 详细信息已发布在: 序列1 seq2 ... 序列1 seq2 ... 下载 人工雨滴生成算法 除了数据集,我们提出了一种算法,该算法可以在图像中生成各种逼真的人工滴。 收集具有各种雨滴的图像是一项艰巨
2021-05-14 17:14:12 12.63MB Python
1
室内HIIT动作识别项目说明 山东大学(威海) 18数据科学孙易泽 本项目为通过微信小程序进行动作的识别,项目拾取了徒手侧平举,前后交叉小跳,开合跳,半蹲四个动作,在测试者左手手持手机的情况下,利用微信小程序实时采集手机的六轴数据,并用随机森林模型和波峰检测法,对测试者做出的动作进行实时的识别和计数。 以下说明,为项目文件中各个文件夹的相关说明 python项目 数据文件夹:训练所用数据,处理之后的数据 进程文件夹:预数据代码,包括信号处理与窗口切割数据 功能文件夹:特征提取以及特征选取相关代码 machineLearning文件夹:各个算法测试比对,算法的优化与提升 numcount文件夹:动作计数相关代码测试 Web文件夹:服务器部署代码 IndoorHIIT.ipynb:python完整的工程说明文档,可在工程中直接查看,或访问以下网址: 微信小程序 小程序已发布,二维码如下: 完
2021-05-12 07:26:02 31.03MB 系统开源
1
素描变压器 建模绘图,快速! 使用变压器的数据集。 火车模型 $ python train.py --on-memory-dataset 预训练模型 一个预先训练的模型( test llh: 3.002 assets/model_1000000.pt )在assets/model_1000000.pt $ python train.py --num-transformer-layers=8 --dropout-rate=0.1 --batch-size=128 --learning-rate=1e-3 --on-memory-dataset --log-freq=10000 产生样品 $
2021-04-27 16:59:49 69.02MB sketch transformers pytorch SketchPython
1
OntoNotes-5.0-NER-BIO 这是CoNLL-2003格式的版本,带有OntoNotes 5.0版本NER的BIO标记方案。 此格式化的版本基于的说明以及在此存储库中创建的新脚本。 简单地说,名为“(Yuchen Zhang,Zhi Zhong,CoNLL 2013),提出了针对OntoNotes 5.0数据的Train-dev-split,并提供了将其转换为CoNLL 2012格式的脚本。 但是,结果不在BIO标记方案中,不能直接用于许多序列标记体系结构中,例如BLSTM-CRF。 此回购协议通过直接生成BIO格式简化了预处理,您可以在实验中使用它们。 步骤1:获取官方的O
1
MAMS for ABSA 此存储库包含论文“ EMCLP-IJCNLP 2019, 挑战数据集和基于方面的情感分析的有效模型”的数据和代码。 彩信 MAMS是用于基于方面的情感分析(ABSA)的挑战数据集,其中每个句子包含至少两个具有不同情感极性的方面。 MAMS数据集包含两个版本:一个用于方面术语情感分析(ATSA),另一个用于方面类别情感分析(ACSA)。 要求 pytorch==1.1.0 spacy==2.1.8 pytorch-pretrained-bert==0.6.2 adabound==0.0.5 pyyaml==5.1.2 numpy==1.17.2 scikit-learn==0.21.3 scipy==1.3.1 快速开始 将经过预训练的GloVe( )文件glove.840B.300d.txt放在./data文件夹中。 修改config.py以选择任务,模型和
1
FMA:音乐分析数据集 , , , 。 国际音乐信息检索学会会议(ISMIR),2017年。 我们介绍了免费音乐档案(FMA),这是一个开放的且易于访问的数据集,适用于评估MIR中的多个任务,MIR是与浏览,搜索和组织大型音乐收藏有关的领域。 但是,社区对功能和端到端学习的兴趣日益增长,这受到大型音频数据集可用性有限的限制。 FMA旨在克服这一障碍,以161个流派的分级分类法,提供来自16,341位艺术家和14,854张专辑的106,574条曲目的917 GiB和343天的Creative Commons许可音频。 它提供全长和高质量的音频,预先计算的功能,以及轨道和用户级别的元数据
1
Waymo打开数据集 Waymo Open数据集于2019年8月首次推出,其感知数据集包括高分辨率传感器数据和1,950个细分的标签。 我们已公开发布Waymo开放数据集,以帮助研究社区在机器感知和自动驾驶技术方面取得进步。 2021年3月更新 我们扩展了Waymo开放数据集,使其还包括一个运动数据集,该运动数据集包含对象轨迹和超过100,000个细分的相应3D地图。 我们已经更新了此存储库,以添加对此新数据集的支持。 请参考。 此外,我们添加了有关实时检测挑战的说明和示例。 请按照以下。 网站 要了解有关数据集的更多信息并访问它,请访问 。 内容 此代码存储库包含: 数据集格式的定义 评估指标 TensorFlow中的Helper功能可帮助构建模型 请参考。 执照 此代码存储库(不包括third_party)已根据Apache许可2.0版获得许可。 出现在third_party中的代
2021-04-20 09:29:52 25.30MB dataset autonomous-driving C++
1
肌读数据集 腕部冬眠,弯曲,伸展,径向偏移,尺骨偏移,内旋,旋后和拳头手势的Myo臂章肌电图读数数据集。 项目结构 读数位于_readings文件夹中,每个记录会话包含一个文件夹。 每个会话文件夹包含多个文件,每个手腕手势一个。 这些文件名为 .txt(例如,扩展名为2.txt,请参见下面的手势标签)。 每个录制会话文件夹应至少包含八个文件(用于手势0-7)。 文件本身由多行组成: ... 11,32,-3,-43,4,5,42,7,0 13,24,-5,12,43,42,12,1,0 123,121,-100,-88,-32,32,123,13,2 ... 每行代表来自Myo臂章上的八个EMG通道的样本([-128,127],有符号字节),以及给定时刻的手腕手势(类)标签,以逗号分隔。 该行的末尾没有逗号,并且文件中的任何地方都不应有空格。 根据Myo规范,采样频率约为2
2021-04-06 15:25:19 8.56MB dataset myo emg myo-armband
1
ADE20K数据集 这是的存储库。 我们提供了有关数据集的一些信息,并提供了用于探索数据的。 概述 ADE20K由来自SUN和Places数据库的27K图像组成。 图像完全用对象注释,跨越3K对象类别。 许多图像还包含对象部分和部分部分。 我们还提供了原始带注释的多边形,以及用于模态分割的对象实例。 图像也被匿名化,使人脸和车牌模糊。 数据集统计 数据集的当前版本包含: 涵盖365个不同场景的27,574张图像(用于训练的25,574张图像和用于测试的2,000张图像)。 来自3688个类别的707868个唯一对象,以及它们的WordNet定义和层次结构。 193,238带注释的对象零件和零件零件。 具有属性,注释时间,深度顺序的多边形注释。 探索数据集 虽然您需要才能访问数据集,但我们在数据集中提供了一个小的子datasets ,以便您熟悉结构。 我们还提供了一个index_a
2021-03-15 14:39:42 4.89MB JupyterNotebook
1
自动简历筛选系统(带有数据集) 一个网络应用程序,可通过分析简历和简历,显示最适合该职位的候选人并筛选出不适合的人来帮助雇主。 描述 使用推荐引擎技术,例如基于内容的协作,基于内容的过滤,以模糊匹配具有多个履历的职位描述。 先决条件 软件 textract == 1.6.3 要求== 2.22.0 烧瓶== 1.1.1 gensim == 3.8.0 sklearn == 0.0 PyPDF2 == 1.26.0 自动更正== 0.4.4 nltk == 3.4.5 宫缩== 0.0.21 textsearch == 0.0.17 拐弯== 2.1.0 numpy == 1.17.2 pdfminer.six == 20181108 Python 3.6.0 | Anaconda 4.3.0(64位)| 数据集 链接1: : 镜像: : 运行本地主机
2021-03-11 15:06:44 3.6MB 系统开源
1