预测泰坦尼克号乘客的生存-Kaggle竞赛 使用技能:NumPy,Pandas,Seaborn,scikit-learn(决策树分类器,SVM),xgboost(XGBClassifier),集成学习 挑战 泰坦尼克号的沉没是历史上最臭名昭著的海难之一。 1912年4月15日,在她的处女航中,被广泛认为的“沉没” RMS泰坦尼克号与冰山相撞后沉没。 不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡。 虽然幸存有一些运气,但似乎有些人比其他人更有可能生存。 在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 使用乘客数据(即姓名,年龄,性别,社会经济舱等)。 我解决挑战的方法 处理数据以解决0,NaN等问题。 进行探索性数据分析以执行功能选择和工程设计 随机选择火车/测试区 训练决策树分类器,XGB分类器和S
2023-01-06 16:05:01 5KB JupyterNotebook
1
Python心脏衰竭分类器 这是kaggle提供的一项任务,其中包括创建一个分类器算法,该算法可以使用血液信息和其他一些功能来预测心脏病发作。 在这个项目中,我尝试了3种不同的机器学习模型,即随机森林分类器,SVC和Logistic回归器,其中两个在数据框中运行良好,但是SVC无法正常工作,因此我决定将其从笔记本中删除,在这个项目中,我专注于数据分析,但是缺少功能工程。 同样在这个项目中,我还没有开始使用github,所以我再次希望你理解这一点并下载数据以运行代码。
2023-01-04 19:45:22 170KB JupyterNotebook
1
Kaggle COVID-19临床试验EDA 我第一次尝试使用Kaggle上与COVID-19相关的临床试验数据集进行EDA。 有关数据集的更多信息,访问: :
2023-01-04 15:49:57 2.48MB eda clinical-trials covid-19 JupyterNotebook
1
简街市场预测 UNIST SDMLAB的协同工作。 ,李英浩(Yeongho Lee)医师KHALEQUZZAMAN CHOWDHURY SAYEM,MUBARRAT CHOWDHURY :triangular_flag: 比赛信息 :label: 名称 Kaggle的 :magnifying_glass_tilted_left: 目的 利用交易机会预测交易行为 :stopwatch: 时间线 2020年11月24日-2021年2月22日(UTC) 实际参与,2021年1月13日 :spiral_calendar: 整体时间表 第一周:了解与EDA的竞争,每个解决方案使用基准代码实施 Youngin:LSTM 英浩:XGBoost Sayem:全面介绍 穆巴拉特:LGBM 第二周:[提高性能]像上面一样单独实施基准代码 第三周:最佳成绩解决方案实施 第4周:[提高绩效]最佳成绩解决方案实施 第5周:未安排 :loudspeaker: 储存库规则 :construction_worker: 结构体 +-- input | +-- data +-- ipynb_
2023-01-02 15:59:58 269.49MB JupyterNotebook
1
Kaggle_Jane_Street_Market_Prediction:https
2023-01-02 15:48:48 20KB JupyterNotebook
1
简街市场预测 作者:刘增丰,崔贤ji,郑家杰 在此项目中,目标是根据市场价格从130点的时间序列中预测市场份额的未来回报值。 该数据集是从竞赛中获得的。 以下是实现这些目标的一些可能步骤: 去噪 滚动平均值 使用小波变换的阈值 使用的机器学习模型: 决策树(CART) 线性回归 k最近邻居 人工神经网络 卷积神经网络
2023-01-02 15:45:06 141KB JupyterNotebook
1
Python深入机器学习的见解 Python深入了解机器学习的代码存储库 代码测试规范 所需软件(含版本):Python(Python v3.5)下载链接: : 所需操作系统:独立于OS的Mac / Windows / Unix 详细的安装步骤(软件方式)应该以一种使系统环境能够测试本书代码的方式列出这些步骤。 请参阅以下链接以获取安装说明:• : l ##相关的Python书籍:
2023-01-01 21:09:49 237.6MB JupyterNotebook
1
预测房屋售价 技术与技能 技术技能:回归,数据清理,探索性数据分析(EDA),数据可视化,机器学习,偏差方差折衷,插补方法,模型验证,统计,特征工程,正则化,集成模型,k均值聚类,管道,网格搜索,转学 技术: Python,Jupyter Notebook,GitHub,Git Python库: Pandas,numpy,sklearn,matplotlib,seaborn,scipy 模型:多元线性回归,岭回归,LASSO回归,k近邻回归,随机森林回归,额外树木回归,支持向量回归,XGBoost回归,主成分回归 概述 该项目将涵盖以下部分: 问题陈述 执行摘要 结论 数据源 数据字典 问题陈述 我对该项目的目标是建立一个可以预测爱荷华州艾姆斯房屋实际售价在25,000美元以内的回归模型。 我将用来评估模型准确性的主要指标包括均方根误差(RMSE)和确定系数(R平方)。 RMSE代表
2023-01-01 12:40:41 1.3MB JupyterNotebook
1
CNNvsNN_Digit_recognizer 进行该项目的目的是在通用数据集上比较卷积神经网络(CNN)和常规神经网络(NN)的性能差异。
2022-12-31 22:01:59 102KB JupyterNotebook
1
K均值分类 IRIS数据集上的k均值分类
2022-12-31 17:32:05 67KB JupyterNotebook
1