Kaggle Landmark Recognition 2020竞赛:优胜者解决方案 该存储库包含针对我们在Kaggle举办的2020年Google Landmark Recognition竞赛获奖解决方案的代码: 完整的解决方案在arxiv上发表的一篇论文中进行了描述: 为了运行此代码,您需要来自GLDv2的训练和测试数据: 要训​​练模型,请使用配置文件作为标志运行src/train.py : python train.py --config config1 您需要在相应的配置文件中调整数据路径和其他参数,以使其正常工作。 混合和排名过程在notebooks/blend_ranking.ipynb详细notebooks/blend_ranking.ipynb 。
2021-10-05 17:04:39 38KB Python
1
数据科学竞争 该仓库用于记录和定期提供各大数据科学竞赛的事件消息和原始基线,思路分享以及博主的一些竞赛心得和学习资料等。主要涵盖:kaggle,阿里天池,华为云大赛校园赛,百度aistudio,和鲸社区,datafountain等 2021/3/3 ( 5/1166等级) 2021/2/19 (银牌) :2nd_place_medal: ) 2021/1/05 (冠军) (亚军) 2020/12/22 ( Rank6三等奖) ( Top4% ) 2020/11/15 ( Top1% ) 2020/10/15: (亚军) (初赛Rank4 ,复赛Rank7 ) (亚军) (三等奖) 2020/10 / (赛道一: Rank10 ,赛道二: Rank4方案) (三等奖)
2021-09-30 19:50:22 4.01MB Python
1
**主要是让参赛选手根据训练集中的乘客数据和存活情况进行建模,进而使用模型预测测试集中的乘客是否会存活。乘客特征总共有11个,以下列出。当然也可以根据情况自己生成新特征,这就是特征工程(feature engineering)要做的事情了。**
2021-09-28 08:59:51 398KB 学习文档
1
kaggle_walmart_dataretail_analysis 货真价实的描述沃尔玛是美国领先的零售商店之一,希望准确预测销售和需求。 某些活动和节假日每天都会影响销售量。 有沃尔玛的45家商店的销售数据。 由于无法预料的需求,业务正面临挑战,并且由于不适当的机器学习算法,业务有时会断货。 理想的ML算法将准确预测需求并吸收诸如经济状况(包括CPI,失业指数等)之类的因素。沃尔玛全年举办几次促销降价活动。 这些降价促销是在最重要的假期(超级碗,劳动节,感恩节和圣诞节)之前进行的,这是假期中最大的四个假期。 在评估中,包括这些假期在内的星期的权重是非假期星期的五倍。 在缺乏完整/理想历史数据的情况下,这场比赛所面临的挑战之一是对降价促销对假期假日的影响进行建模。 提供了位于不同地区的45家沃尔玛商店的历史销售数据。
2021-09-26 08:17:14 1.24MB JupyterNotebook
1
kaggle mnist 训练和测试csv文件,包括 train和test两部分
2021-09-25 21:56:35 14.88MB mnist kaggle
1
kaggle经典问题-泰坦尼克预测,结果为0.81818,包括:代码,实验数据,代码运行得到的数据。
2021-09-24 15:12:22 39KB code
1
PyTorch_DistractedDriverDetection 1 项目概述: 1.1 项目来源: kaggle中的【State Farm Distracted Driver Detection】比赛的实现。 1.2 问题概述: 对一张关于驾驶员行为的图片进行分类,共10类:安全驾驶/左手打字/右手打电话/左右打电话/... 1.3 问题解决思路: 采用resnet34进行finetune 1.4 数据集下载地址: 2 程序运行相关: 2.1 运行环境: windows/python3.5/pytorch0.4/visdom 2.2 运行前的准备: s1:下载本repository至本地; s2:在本目录下,建立文件夹如下,并下载train数据集至data文件夹下: ----data --train ----trained_models 2.3运行: s1.打开visdom后台:pyt
2021-09-24 10:13:34 182KB Python
1
深度预测房价EDA 在该项目中,使用Kaggle's competition数据集。 在此过程中,我们将经历: 使用IQR和z-score方法去除异常值 可视化categorical变量和continuous变量 如何处理string dtype列以构建machine learning model 处理missing价值 入门 该可在Kaggle上使用,可在创建该笔记本的相同环境中使用,即使用所使用的相同版本的软件包等。 发现 要了解EDA阶段的发现,请进入 机器学习模型 学习曲线 RMS和R2分数 根据实际值可视化我们的预测 执照
2021-09-23 20:13:50 6.53MB JupyterNotebook
1
https://www.kaggle.com/c/loan-default-prediction
2021-09-22 18:18:45 183.41MB Kaggle creditcard 训练集
1
kaggle糖尿病性视网膜病 一般的 该存储库包含AI眼睛团队在Kaggle的糖尿病性视网膜病变检测比赛中的工作。 此README.md文件包含有关如何正确运行算法的一些信息。 单一模型的管道 python train.py (使用data / processed文件夹中存在的train / test分割!这很重要!) 这将训练模型并将模型,kappa图和最佳权重放置在models/文件夹中。 python optimize_threshold.py 这需要模型,最佳权重,验证拆分和真实标签。 它将用于验证集的最佳阈值输出到models//optimal_thresholds 。 python predict.py 这需要测试集图像,样品提交,模型,最佳权重和最佳阈值。 它将测试集的预测输出到
2021-09-21 21:18:31 223KB Python
1