人力资源分析师 如果您也想查看其他笔记本和解决方案,可以在Kaggle中找到此挑战: 上下文和内容 一家活跃于大数据和数据科学领域的公司希望在成功通过该公司的某些课程的人员中聘用数据科学家。 许多人报名参加他们的培训。 公司想知道在培训或寻找新工作后,其中哪些候选人真的想为公司工作,因为这有助于降低成本和时间,并减少培训或计划课程和候选人类别的质量。 候选人注册和注册后即可掌握与人口统计,教育,经验相关的信息。 该数据集旨在了解导致人员也离开当前工作进行人力资源研究的因素。 通过使用当前证书,人口统计,经验数据的模型,您可以预测应聘者寻找新工作或将为公司工作的可能性,并解释影响员工决策的因素。 整个数据分为训练和测试。 目标未包含在测试中,但测试目标值数据文件可用于相关任务。 提交的样本对应于测试集的enrollee_id,该列也提供了以下列: 笔记: 数据集不平衡。 大多数功能都是
2022-12-20 21:00:15 396KB JupyterNotebook
1
r-kaggle-泰坦尼克号 #Titanic生存预测 该存储库包含我针对Kaggle的《泰坦尼克号生存预测问题》的一些方法。 该存储库包括用于功能选择的脚本,用于数据建模的替代策略,原始测试和训练数据集以及为其生成的可视化图。 所有代码段均以R编写。 泰坦尼克号生存预测问题 在这一普遍的挑战中,目标是根据性别,阶级,机票详细信息,年龄类别等属性来预测什么样的人可能度过泰坦尼克号灾难。 程式码范例 去做 动机 列出的示例代码中的一种方法已提交给Kaggle。 安装 数据集可以在“数据”文件夹中找到。 它包括2个分别用于培训和测试的csv文件。 train.csv(59.76 kb) test.csv(27.96 kb) 使用以下R包。 seqinr:生物序列检索和分析 e1071:统计部概率论小组的其他职能(以前为E1071),维也纳工业大学 派对:递归派对的实验室 Ame
2022-12-16 11:06:19 77KB R
1
卡格格-泰坦尼克号 这使用Common Lisp解决了kaggle教程“”。 2015/10/19:我决定首先使用朴素的贝叶斯分类器。 但是,我认为这不是执行此任务的正确方法。 我只想知道这种“幼稚”的方式可以达到什么速率作为基准。 用法 首先,您需要从上述kaggle教程中获取“ train.csv”和“ test.csv”(还需要注册Kaggle)。 然后,将它们放在该项目下的“资源”目录中。 该项目导出两个函数“ main”和“ cross-validate”。 “主要”功能 学习使用“ train.csv”中的所有数据。 使用“ test.csv”中的所有数据将分类结果输出到“ resources / result.csv” (kaggle-titanic:main) “交叉验证”功能 使用“ train.csv”中的数据进行k交叉验证。 (k = 5) 将结果输出到标准输
2022-12-16 10:45:24 10KB CommonLisp
1
Kaggle竞赛解决方案-使用LightGBM算法预测二手商品的成交概率 avito是一家俄罗斯公司,从网站上来看是一个线上购物平台,这一次题目的目标,就是预测某一个商品在某一天被售出的概率,给定的数据有一段时间内的商品的销售情况(数量,价格,地区,品类,商品的俄文描述,商品的图片)等信息。 Avito提供了多个数据集, 除了主要的训练集(train.csv, 150万+样本)和测试集(test.csv, 50万+样本)外, 还有train_active.csv/test_active.csv(和train/test同时期的数据, 但没有成交概率和图片信息); periods_train.csv/periods_test.csv(只包含了active数据中每件商品的id, activation_date - 广告投放日期, date_from/date_to - 广告展示的第一天和最后一天); train_jpg.zip/test_jpg.zip(train和test样本的图片)。
2022-12-14 20:27:02 298KB python lightGBM 机器学习
1
其中包含训练集和测试集,供大家学习使用
2022-12-13 13:25:56 696KB kaggle 房价预测
1
包含Kaggle比赛:房价预测数据集,实战的介绍文档及预测结果。 房价预测数据集分为训练数据集和测试数据集。两个数据集都包括每栋房子的特征,如街道类型、建造年份、房顶类型、地下室状况等特征值。这些特征值有连续的数字、离散的标签甚至是缺失值“na”。只有训练数据集包括了每栋房子的价格,也就是标签。
2022-12-08 15:28:47 196KB kaggle比赛 房价预测 深度学习实战
1
cifar10文件夹:包括了cifar10原数据库 kaggle文件夹:包括了在kaggle上训练好的模型,以及日志文件 model文件夹:包括了本地cpu训练好的模型 src文件夹:kaggle_tensorboard.py: 用于使用tensorboard展示kaggle上训练的日志 model.py: 神经网络模型 res_model:残差网络模型 有问题就发邮件。GuanlinLi_BIT@163.com
2022-12-01 21:45:12 219.52MB 神经网络 cifar10 pytorch 残差神经网络
1
卡格 Kaggle 比赛的代码和数据 otto:奥托集团产品分类挑战赛
2022-11-29 22:40:46 5.75MB Python
1
野火 分析在Kaggle上找到的Wildfires数据集。 该数据集包含1992年至2015年美国的野火数据。 文件说明: c_10nv20(1).zip:美国各县及相应的几何数据->来源: ://www.weather.gov/gis/Counties wildfires.7z:来自Kaggle的原始sqlite数据库->来源: ://www.kaggle.com/rtatman/188-million-us-wildfires?select FPA_FOD_20170508.sqlite wildfires.ipynb:Jupyter Notebook,包含对数据集的所有分析。 工作正在进行中!
2022-11-26 22:15:13 18.61MB JupyterNotebook
1
Kaggle National Datascience Bowl 2017第二名 这是我在Kaggle.com主办的第二名解决方案中我的源代码。 有关该方法的文档,请访问: ://juliandewit.github.io/kaggle-ndsb2017/ 请注意,这是我的代码部分。 我的队友Daniel Hammack的工作可以在以下位置找到: : 依赖关系和数据 该解决方案是使用Keras和Windows 64位上的tensorflow后端构建的。 接下来,我使用了scikit-learn,pydicom,simpleitk,beatifulsoup,opencv和XgBoost。
2022-11-26 21:51:05 65KB machine-learning deep-learning tensorflow keras
1