Home Credit 违约风险 - Kaggle 竞赛 https://www.kaggle.com/c/home-credit-default-risk/code 背景 在Kaggle Home Credit 违约风险竞赛中,参与者试图从应用程序、人口统计和历史信用行为数据中预测客户未来的支付行为。由于我在金融方面的学术背景,我想尝试一下信用风险数据集,这似乎是一个有趣的挑战。 0.8 的 ROC AUC 足以跻身本次比赛的获胜者之列,所以这就是我的目标。我想在这个数据集上尝试一些新方法,例如使用自动编码器进行特征缩减。 当前状态 主数据集包含 120 个特征和一个二进制目标变量。使用补充数据集,我能够将独立特征数增加到 1400 多个。我进行手动特征选择以将维度降低到 290 个最重要的特征。我目前正在使用自动编码器来替代手动特征选择。 使用 LightGBM,我能够获得超过 0.78 的 ROC AUC。现在我将不得不进行超参数调整以改进这个结果。
2022-01-28 09:06:23 732KB Kaggle
pdf文档,从网上直接下载的,共享出来。如果没有积分,可以直接私信我:-)
2022-01-26 10:30:34 39.19MB python 机器学习
1
《 Python机器学习及实践:从零开始创造Kaggle竞赛之路(第2版)》开源数据和代码 本书的数据集,工具和代码:DIY_ML_Systems_with_Python_2nd_Edition 第二版概要: 《 Python机器学习实践(第二版)》一书适合所有对(深度)机器学习(Machine Learning),数据挖掘(Data Mining),以及自然语言处理(Natural Language Processing)的技术实践研究的初学者。 本书从零开始,以Python编程语言为基础,在不重复叙述大量数学模型与复杂编程知识的替代下,逐步将读者逐步熟悉并掌握当下最流行的(深度)机器学习,数据挖掘以及自然语言处理的开源工具库(包):Scikit学习,Google Tensorflow,Pandas,Matplotlib,NLTK,Gensim,XGBoost,OpenAI Gym等。
2022-01-08 10:44:30 295.19MB 系统开源
1
kaggle-driver-telematics-analysis Kaggle竞赛“驾驶员远程信息处理分析”。 makefeatures.py-将所有路线的77个要素组成一个numpy数组。 merge.py-将来自2种不同算法的结果合并到csv中。 randomforest.py-使用随机森林从numpy的77个特征数组中进行预测 svm.py-使用svm从77个功能的numpy数组进行预测 我最好的结果是来自没有合并的randomforest的0.91051(125th / 1528)-前10%。 svm并将rf与svm合并产生了较差的结果(0.87060和0.90004)
2022-01-05 14:48:37 5KB Python
1
科比布莱恩特20年职业篮球生涯中的投篮命中率相关数据。
2022-01-03 09:55:44 680KB Kaggle 体育数据 篮球比赛数据
1
遗传突变分类竞赛【Kaggle竞赛】.zip
2021-12-26 17:39:26 158.34MB 遗传突变分类
1
医疗CT影像、年龄和对比标注数据医疗CT影像、年龄和对比标注数据医疗CT影像、年龄和对比标注数据医疗CT影像、年龄和对比标注数据
2021-12-26 17:30:11 361.87MB 医疗CT影像 年龄 对比标注数据
1
根据安检人体扫描成像预测威胁竞赛根据安检人体扫描成像预测威胁竞赛根据安检人体扫描成像预测威胁竞赛根据安检人体扫描成像预测威胁竞赛
1
机器学习预测住房价格 房价-高级回归技术的Kaggle竞争:使用机器学习来预测爱荷华州的房价。 查找kaggle竞赛的链接: ://www.kaggle.com/c/house-prices-advanced-regression-techniques 该存储库有几个文件: Code_Predicting房屋价格.py:是带有项目代码的jupyter笔记本。 它还具有注释,以帮助您理解开始代码的思考过程。 预测房价艾姆斯,爱荷华州:pptx:介绍该项目的简报。 它面向具有一定技术知识的公众。 预测房价Iowa.docx.pdf:博客文章,解释了该项目的技术和业务方面。 train.csv:用于项目的数据。 它已上传到github上,为您提供方便,也可以在Kaggle的网页上获取。
2021-12-25 18:51:46 2.4MB JupyterNotebook
1
如何在Titanic Kaggle挑战中获得0.8134分:泰坦尼克号Kaggle竞赛的解决方案
2021-12-12 14:27:23 599KB visualization python machine-learning tutorial
1