基于Kaggle Plant Seedlings Classification竞赛 不利用深度学习 只用特征提取和传统机器学习完成图像分类并达到78%的准确率
2021-12-31 11:06:25 1.19MB Kaggle 机器学习 图像分类 图像特征
1
之前找了很久才找到了,传上来更大家共享下,希望对大家有帮助,欢迎下载或者永久保存。 本文件为kaggle中的信用评分数据,如不方便在kaggle上下载的,可在这里下载。 -- 下载资源需要2分,这是CSND的最低设置,各位只能自行想办法了==!
2021-12-31 10:27:11 4.55MB kaggle信用卡评分数据
1
奥托产品分类 这是我的Kaggle Otto产品分类代码 结果:340/3515
2021-12-30 15:07:50 12KB Python
1
2012年edX平台上线后4年间290个哈佛和MIT在线课程和450万参与者的数据。
2021-12-29 22:31:42 65KB Kaggle数据集
1
Kaggle的Quora重复问题检测比赛的解决方案 可以通过以下链接找到比赛: ://www.kaggle.com/c/quora-question-pairs使用该解决方案,我在3307个团队中排名第23(最高1%)。 考虑到其他顶级解决方案,这是一个相对轻量级的模型。 先决条件 从下载预训练的单词向量,即Gloves.840B.300d,并将其放入项目目录。 从下载火车和测试数据。 创建一个名为“数据”的文件夹并将其放入。 将所有软件包安装在requirements.txt中。 管道 该代码是用Python 3.5编写的,并在装有Intel i5-6300HQ处理器和Nvidia G
2021-12-28 22:47:54 63KB nlp neural-network regex siamese-network
1
是针对全美个人和小企业医疗健康与牙医保险的市场数据,涵盖保险范围、种类、费率、保险计划内容、网络、商业条款、收益与支出等,由美国健康与国民服务部发布。
2021-12-28 16:08:18 597.32MB 美国医疗保险 Kaggle
1
糖尿病视网膜病变竞赛的解决方案 这是Kaggle的竞赛,您的任务是将每个人的眼部检查分类为5种不同程度的糖尿病导致的疾病。 这是我用来处理原始图像的代码的存储库,即卷积神经网络模型(使用keras构建)。 它主要基于论坛中提供的一个基准。 执行以下步骤: 仅使用普通图像处理到256X256,未使用其他方式调整颜色等。 通过增加1、2、3和4类来平衡不同类的图片。 使用过的VGG风格架构,使用开普勒K20c GPU,以10个时期进行训练,批量大小为32。 它运行约2天。 由于输出是有序的(疾病的阶段),因此不作为分类问题运行,而是作为回归问题运行。 将原始输出转换为疾病阶段标签。 天真的,我们可以转换到接近阶段。 但是,根据原始数据集的比例对原始分数进行排名会产生更好的Kappa分数。 最后,该模型在私有数据集上得出的Kappa为0.38,由于辍学,该结果在公共得分上接近0.3
2021-12-28 16:07:35 278KB Python
1
Kaggle房屋价格预测完整资源-Kaggle-house-prices-advanced-regression--techniques,包括train.csv test.csv sample_submission.csv data_description.txt
2021-12-28 13:32:43 176KB Kaggle house prices 房屋价格预测
1
美国婴儿姓名数据是一个来自美国社会保障应用的数据,从国家和州两个维度对新生婴儿姓名进行统计,为了保障个人隐私相同姓名的婴儿在5名以上。
2021-12-27 14:41:29 149.4MB 婴儿姓名 Kaggle
1
选题背景 Titanic生存概率预测是Kaggle平台上的经典竞赛项目,泰坦尼克号成员存活的数据集非常适合新手开始作为机器学习项目和Kaggle竞赛的练手。我们将在该项目中探索具备何种特征的人在此次海滩中幸存的几率更高,并通过改建机器学习模型和深度学习模型来预测乘客的生存率。Titanic项目的描述如下所示: 泰坦尼克号的沉没是历史上最声明远扬的航海事件 1912年4月15日,在她的处女航中,被广泛认为的“沉没” RMS泰坦尼克号与冰山相撞后沉没。 不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡 虽然幸存有一些运气,但似乎有些人比其他人更有可能生存 在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 您可以使用乘客数据(即姓名,年龄,性别,社会经济舱等)来进行预测 开发环境 操作系统:Macos Python版本:3.7.4 Anaconda版本:4.9.2 tensorflow版本:2.1.0 keras版本:1.1.0 1 数据源集数据处理 1.1 数据源 数据集来自Kaggle网站提供的数据集,Kaggle提供的乘员数据分为两个部分: 训练集(train.csv) 测试集(test.csv) 训练集将用于构建我们的机器学习/深度学习模型。并且在训练集中对于每位乘客我们会有表示该乘客是否存活的label,也就是survival字段。在训练集中会给出每一位乘客的特征,我们需要从这些乘客的特征当中学得一些知识,或者可以使用特征工程来创建新的特征来帮助模型的构建 测试集数据将用来评判我们模型的表现。因此对于测试集中的每一位乘客没有代表该乘客是否存活的label,我们的模型需要根据每一位乘客的特征值来输出相应的label,真实的label将由kaggle网站保留
2021-12-27 12:03:14 418KB kaggle