数据来自产品在Bosch真实生产线上制造过程中的设备记录,体现了每件产品在生产过程中的相关参数和设备运转情况,希望以此来降低次品产品的产生和下线。
2021-12-06 09:56:43 655.18MB 流水线 降低次品率 工业生产
1
这是我读《python机器学习及实践-从零开始通往kaggle竞赛之路》时自己写的代码,包括了3.2节之前的所有代码,详见https://www.xxy.ink/learn/ml/1.html,相对于书中代码略有改动,比如分类加入了混淆矩阵、修改了书中报错的部分等,保证都是可以运行的
2021-12-05 19:06:10 495KB python机器学习及实践 全书代码 kaggle
1
从。 我们从代码和伟大的代码中学到更多。 不一定总是排名第一的解决方案,因为我们还了解了是什么造就了出色且良好的解决方案。 我会发布我遇到的解决方案,这样我们都可以学习变得更好! 我从 Kaggle 举办的比赛中收集了以下源代码和有趣的讨论,以供学习。 没有列出所有比赛,因为我只是手动收集它们,还有一些比赛由于没有人分享而没有列出。 随着时间的推移,我会添加更多。 谢谢你。 。 。 Alessandro Mariani 的。 B1aine。 e by Hiroyuki。 MrCanard。 。 Paul Duan 和 Benjamin Solecki 团队的。 Paul Duan 。 Owen Zhang 的排名 2 解决方案代码。 Dmitry & Leustagos
2021-11-30 20:25:04 6KB
1
贷款违约预测竞赛数据,是个人的金融交易数据,已经通过了标准化、匿名处理。包括200000样本的800个属性变量,每个样本之间互相独立。每个样本被标注为违约或未违约,如果是违约则同时标注损失,损失在0-100之间,意味着贷款的损失率。未违约的损失率为0,通过样本的属性变量值对个人贷款的违约损失进行预测建模。数据来自英国帝国理工大学。
2021-11-24 14:53:08 581.69MB 信用评分 违约损失预测
1
广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
共享单车需求 Kaggle 竞赛预测城市共享单车系统的使用情况 看看比赛: : 。 以下是项目描述的摘录。 自行车共享系统是一种租用自行车的方式,通过整个城市的售货亭位置网络,自动获得会员资格,租借和退还自行车的过程。 使用这些系统,人们可以从一个地方租借一辆自行车,然后根据需要将其归还到其他地方。 目前,全球有500多个自行车共享计划。 这些系统生成的数据对研究人员很有吸引力,因为旅行的持续时间、出发地点、到达地点和经过的时间都被明确记录下来。 因此,共享单车系统充当传感器网络,可用于研究城市中的移动性。 在本次比赛中,参与者被要求将历史使用模式与天气数据相结合,以预测华盛顿特区首都共享单车计划的自行车租赁需求 致谢 Kaggle 正在举办这场比赛,供机器学习社区用来娱乐和练习。 该数据集由Hadi Fanaee Tork使用来自Capital Bikeshare的数据提供。 我
2021-11-15 20:18:00 783KB R
1
数字识别器-Kaggle 使用 Scikit-Learn 进行数字识别器 Kaggle 比赛。 文件 train.csv 和 test.csv 必须在工作目录中。 SVM_poly_deg2: 使用 SVM 进行数字识别(poly,degree = 2) Kaggle 准确率:0.97871 对于完整的数据集: 读取(预处理)时间 ~ 25.5 s 训练运行时间 ~ 146.5 s 预测运行时间 ~ 161.5 s (处理器:1.7 GHz Intel Core i7,内存:8 GB) SVM_rbf: 使用 SVM (rbf) 预处理数据的数字识别 Kaggle 准确率:0.96457 对于完整的数据集: 读取和缩放数据运行时间 ~ 25.0 s 训练运行时间 ~ 398.5 s 预测运行时间 ~ 346.8 s (处理器:1.7 GHz Intel Core
2021-11-04 01:44:28 3KB Python
1
Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台由于举办多种领域的数据分析、机器学习竞赛,具有很多有价值的数据集可供下载。Kaggle 的数据集很难下载,这里提供了一个文本分类的数据集,供大家使用。
2021-11-01 21:08:20 69.41MB NLTK Kaggle NLP 自然语言处理
1
根据房屋租赁信息创建的日期和其它相关特征,预测该租赁信息预计被查询点击的次数,进而提供欺诈控制和信息质量监测,使房屋业主和代理人更好的理解租户的需求和偏好。
1
Reddit 用户交互记录【Kaggle竞赛】.zip
2021-10-22 14:40:00 82.68MB Kaggle竞赛 用户交互记录
1