b站菊安酱机器学习配套数据集
2021-11-09 14:08:27 1.86MB python 机器学习
1
数据集 此存储库包含用于下载,预处理和数字化流行的机器学习数据集的脚本。 在整个项目中,我通常会发现自己重写了相同的代码行以标准化,规范化或其他化数据,对分类变量进行编码,解析出要素的子集以及其他杂项。 为了减轻重复使用的麻烦,此存储库使用了模板样式的定义,该定义用于应如何解析数据集,而库则负责其余部分。 对于加载数据,它支持numpy.genfromtxt可以使用和arff任何内容(来自 )。 为了处理数据,在utils/scale.py和utils/preprocess.py有许多流行的scikit-learn preprocessing转换器的包装器。 主要的魔力可以在utils/handler.py找到; 在底部,提供了示例模板。 参数为: 争论 描述 header 标题行是否存在(将被删除) include 只加载指定的列 label 标签索引 norm unit
2021-10-06 17:18:08 26.14MB machine-learning numpy phishing python3
1
家用电耗的测量 该分配使用来自UC Irvine机器学习存储库的数据,该库是机器学习数据集的流行存储库。 特别是,我们将使用我在课程网站上提供的“个人家庭用电量数据集”:数据集:电力消耗[20Mb]描述:测量一个家庭中一个家庭的电力消耗-在近4年内的分钟采样率。 提供不同的电量和一些子计量值。 数据集中9个变量的以下描述来自UCI网站:日期:日期格式为dd / mm / yyyy时间:时间格式为hh:mm:ss Global_active_power:家庭全球分钟平均有功功率(千瓦) )Global_reactive_power:家庭全球分钟平均无功功率(以千瓦为单位)电压:分钟平均电压(以伏特为单位)Global_intensity:家庭全球分钟平均无功电流(以安培为单位)Sub_metering_1:1号电能子计量表(以瓦特为单位)小时的有功电能)。 它对应于厨房,主要包含洗碗机,烤箱
2021-09-14 15:20:13 24KB R
1
机器学习的数据集,预测医疗花费,一共是1070行,7列。即7个属性,分别是年龄、性别、bmi指数、孩子个数、是否吸烟、地区、医疗花费。
2021-09-14 09:08:09 44KB 机器学习 数据集
1
该数据集包含了7种带钢缺陷类型。这个数据集不是图像数据,而是带钢缺陷的28种特征数据,可用于机器学习项目。
2021-08-25 18:11:12 83KB 机器学习 数据集
1
航班数据集flights.csv .该文件统计了从1949年到1960年的航班信息,主要是每月登机人数,文件列名分别如下year,month,passengers
2021-08-20 15:41:47 2KB 机器学习,数据集,人工智能
1
DGA恶意域名数据集,可以用于深度学习网络训练集,笔者用于基于注意力机制LSTM的DGA恶意域名检测
2021-08-20 01:02:12 5.64MB DGA 深度学习数据集 恶意域名
1
Feature selector一个用于减少机器学习数据集维数的工具
2021-08-19 16:24:25 3.12MB Python开发-机器学习
1
包含常用UCI标准测试数据集。
1
机器学习数据集
2021-07-20 11:21:38 20.74MB 机器学习数据集
1