数据为1908年以来世界范围内的空难信息。
2022-05-04 18:13:08 597KB 空难数据 Kaggle
1
竞赛中,数据集中包括60秒的传感器数据序列进行分类,指示受试者在序列期间是否处于两种活动状态之一。 train.csv : 训练集,包括约26000个60秒的13个生物传感器的记录,供近1000名实验参与者使用 - sequence: 序列,每个序列的唯一id - subject: 受试者,实验中受试者的唯一id - step: 步长,录制的时间步长,以1秒为间隔 - sensor_00-sensor_12: 13个传感器在该时间步的值 train_labels: 标签, csv-每个序列的类标签。 - sequence: 序列,—每个序列的唯一id。 - state:状态,与每个序列关联的状态。这就是你试图预测的目标。 test.csv :测试集。对于12000个序列中的每一个,您都应该预测该序列状态的值。 sample_submission.csv :提交样品,csv-正确格式的示例提交文件。 后继将写一篇关于如何使用数据集的文章,敬请关注。
2022-05-03 17:05:45 171.31MB 机器学习 kaggle sklearn
1
从面部表情实时情感分析 从面部表情实时进行人类情绪分析。 它使用了深度的卷积神经网络。 使用的模型在测试数据上的准确性达到63%。 实时分析器为当前情绪分配合适的表情符号。 模型实现是在keras中完成的。 一些预测的输出: 使用的表情符号: 实时情绪分析器快照 从图中可以明显看出,给定帧的模型预测是中性的。 模型架构 文件清单 facial Emotions.ipynb :Jupyter笔记本,具有记录完整的代码,从开始到培训都说明模型准备。 可用于重新训练模型。 main.py :主python webcam_utils :用于从面部实时检测情绪的代码prediction_utils :
1
Bosch 流水线降低次品率数据【Kaggle竞赛】.zip
2022-04-28 10:23:54 278.77MB 流水线降低次品率数据
1
实战Kaggle比赛:房价预测-数据集
2022-04-25 20:07:23 201KB 文档资料
kaggle 赛题 elo-merchant-category-recommendation 数据集
2022-04-25 18:09:53 614.8MB kaggle 数据集
1
sklearn-feature-engineering 前言 博主最近参加了几个kaggle比赛,发现做特征工程是其中很重要的一部分,而sklearn是做特征工程(做模型调算法)最常用也是最好用的工具没有之一,因此将自己的一些经验做一个总结分享给大家,希望对大家有所帮助。大家也可以到我的博客上看 有这么一句话在业界广泛流传,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 特征工程主要分为三部分: 数据预处理 对应的sklearn包: 特征选择 对应的sklearn包: 降维 对应的sklearn包: 本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明,首先导入IRIS数据集的代码如下: 1 from sklearn.datasets
2022-04-25 12:37:34 8KB sklearn kaggle feature-engineering Python
1
机器学习+2020年心脏病数据集+来自于kaggle
2022-04-18 14:08:24 3.13MB 机器学习
1
FashionAI2018 服装属性标签识别 环境 caffe+keras python 2.7 numpy 1.14.2 opencv 3.4.0 cuda9.0 cudnn 7.0 文件说明: caffe部分: 使用InceptionV4举例,该网络在复赛中可以实现94.11的准确率。 训练网络使用training.sh 修改相应的路径,即Log、TOOLS、-weights后面的路径,其中,Inception-V4的pretrain-model请到下载 。 使用方法bash training.sh [solver][Class][GPU]。 solver : solver文件路径,本代码中存放于solver文件夹 class: 类别名,用来命名log日志文件,即neck,collar... GPU : GPU的型号,如0,1,2 2. caffe源码处理 ,并用文件中的src和inc
2022-04-14 22:32:38 6.49MB kaggle classification tianchi fashionai
1
数据简介 ID:每次行程的唯一ID vendor_id: 行程提供者的ID pickup_datetime: 上车的日期和时间 dropoff_datetime - 停表的日期和时间 passenger_count - 车辆中的乘客数量(驾驶员输入值) pickup_longitude - 上车的经度 pickup_latitude - 上车的纬度 dropoff_longitude - 下车经度 dropoff_latitude - 下车的纬度 store_and_fwd_flag - 行程记录是否为存储转发(或是直接发送) trip_duration - 行程持续时间(秒)
2022-04-13 17:06:34 75.03MB 交通大数据 taxi 开源 研究
1