视觉分析实验室项目2020/21 约翰内斯·开普勒大学林茨分校视觉分析实验室项目的提交。 小组成员 名 姓 GitHub个人资料 分析的一部分 [菲利普] [Meingaßner] 相似属性的聚类/预处理的一部分 [特里斯坦] [班达] 相关分析 [Nikita] [科列斯尼琴科] 描述统计/预处理的一部分 [罗伯特] [Königshofer] 演示/预处理/数据集查找 数据集 数据集是关于什么的? 您从何处获得此数据集(即,数据集的来源)? 我们选择的数据集是关于1800年至2100年(预测的80年)期间全球各国的预期寿命。 我们从Gapminder网站获取了数据集。 资料来源: :
2021-12-27 14:30:43 307KB HTML
1
95云:38云数据集的扩展 ( )中引入的95-Cloud是对我们先前发布的云检测数据集( )的扩展。 它由384 * 384的34,701个补丁组成,用于培训。 95云的测试集与38云的测试集完全相同。 训练补丁是从75个Landsat 8 Collection 1 Level-1场景中提取的,这些场景大多位于北美。 95-Cloud的测试集包括20个场景的9201个补丁。 95云和38云的测试集完全相同。 但是他们的训练方式是不同的。 95-Cloud的场景比38-Cloud的要多训练57个场景。 每个贴片具有4个对应的光谱通道,分别是红色(波段4),绿色(波段3),蓝色(波段2)和近红外(波段5)。 与其他计算机视觉图像不同,这些通道不会合并在一起。 相反,它们位于其对应目录中。 数据集的目录树与38-Cloud完全相同。 由于篇幅所限,该数据集分为两部分:95个云训练+的
2021-12-23 13:26:25 2KB
1
如何使用AWS EC2 Hadoop集群处理200 GB数据 存储200 GB的NYC出租车数据集并部署Cloudera Hadoop集群以对其进行可视化。 使用Python Datashader绘制和可视化Hadoop大型数据集 没有Datashader的可视化 工作流程概述 使用数据着色器 最终可视化
2021-12-23 11:05:42 1.68MB jupyter-notebook pyspark dask datashader
1
来自的来自世界各地的开放数据门户网站和目录的数据集。
2021-12-20 14:35:49 39KB
1
LOCO:上下文中的物流对象 LOCO是第一个用于物流的场景理解数据集,涉及检测特定于物流的对象的问题。 使用低成本相机在物流环境中行走时捕获图像。 我们目前提供在5种物流环境中捕获的37,988张图像,其中5593张图像被手动注释,从而产生152,421条注释。 带注释的类包括叉车,码垛车,货盘,小型装载机和釜馏物。 有关更多详细信息,请参阅我们的。 如果您使用LOCO进行研究,请考虑引用我们的工作( )。 数据集 数据 带注释的数据集可在下载。 此外,我们还在提供其他数据(未注释)。 注解 注释以存储在rgb/loco-all-v1.json 。 为了易于使用,我们还为每个子集提供了单独的注释文件。 学分和引用方式 没有包括Dimitrij-Marian Holm,Benjamin Molter,Nikolai Ruof和Mubashir Hanif在内的出色团队以及所有辛勤工作的
2021-12-20 09:54:37 15.42MB
1
葡萄酒品质预测 对的Kaggle数据集进行建模。
2021-12-19 11:58:17 26KB Python
1
TwitterSentimentDataset 西班牙语情感数据集 它包含约250k西班牙语推文或Twitter api所识别的推文,该数据集已自动生成并用于生成粗粒度的情感分类器。 积极情绪的推文继续:)或:-) 带有负面情绪的推文包含:(或:-( 没有情感的分类推文 推文不会重复。
2021-12-17 17:11:27 8.21MB
1
网络管道:网络流量数据管道,用于实时预测和构建深度神经网络的数据集
2021-12-14 14:08:07 314KB redis flask machine-learning django
1
人工神经网络 纸质数据和代码 这是AAAI 2019论文: 的代码。 我们已经在Tensorflow和Pytorch中实现了我们的方法。 这是我们在论文中使用的两个数据集。 下载数据集后,您可以将它们放在文件夹datasets/ : 友情链接: ://2015.recsyschallenge.com/challenge.html DIGINETICA: ://cikm2016.cs.iupui.edu/cikm-cup或 文件夹datasets/包含一个小的数据集sample ,可用于测试代码的正确性。 我们还写了解释该论文。 用法 您需要先运行文件datasets/preprocess.py来预处理数据。 例如: cd datasets; python preprocess.py --dataset=sample cd datasets; python preproces
1
Jupyter调查 该存储库包含Project Jupyter和IPython收集的数据集和调查。 将数据添加到此存储库 要将数据集添加到此存储库,请在相关顶级目录下创建一个语法YYYY-MM-short-description的子目录。 例如,如果它是调查数据,则在surveys顶级目录下创建文件夹。 在该目录中,请创建一个新的README.md文件,其中包含数据的简短描述,包括: 收集日期 谁收集数据 人口是什么(如果是人类数据),可以在哪里找到代码(如果是模拟数据)或有关数据源的其他相关信息 您可能还希望提供有关如何引用数据集的信息,例如DOI。 如果没有DOI,则可以通过将数据集上载到等服务来获得DOI。 Jupyter用户调查 Jupyter用户调查的材料和结果。 IPython用户调查 IPython用户调查的材料和结果。 我们在2011年和2013年进行了IPython
2021-12-08 21:36:17 7.63MB JupyterNotebook
1