给大家分享一套课程——Kaggle十大案例精讲课程,附课件+代码+数据。希望对大家学习有帮助。
2021-11-23 18:04:11 822B kaggle java
1
Kaggle数据集工作 我的项目正在处理各种Kaggle数据集 专案 从胸部X光照片进行肺炎分类(2021年2月12日-至今) 使用 看到当前和了解更多详情。 Spotify歌曲人气回归(2021年2月8日-2021年2月12日) 使用 经过训练的RandomForest,DNN,LinearRegression和LinearSVR可以预测歌曲的流行程度。 获得了12.300的RMSE错误,其准确度比猜测的平均受欢迎程度高近2倍。 见和了解更多详情。
2021-11-22 23:07:48 19.44MB data-science machine-learning JupyterNotebook
1
使用内置摄像头分散驾驶员注意力 在此任务中,我使用了一个深层神经网络(ResNet50模型)(内置 )如果司机从道路分心走来检测。 用于训练网络的数据集来自 ,它由代表驾驶员行为的十个类别的图像组成。 管道架构: 数据加载和可视化。 火车验证拆分。 加载并微调ResNet50。 模型训练。 测试我们的最终模型。 我将在下面详细解释每个步骤。 步骤1:数据加载和可视化。 如前所述,在此任务中,我使用Kaggle状态农场分散驾驶员检测,它包括10个类别,代表驾驶员在监控道路时的行为,这些类别是(安全驾驶,发短信-正确,电话交谈-正确,发短信-左侧,电话交谈-左,操作收音机,喝酒,伸手去后,头发和化妆,与乘客交谈),共收录近22424张图像,每个班级均收录近2000张图像,分布如下: 第2步:火车验证拆分。 将十个类别的所有图像加载到一个列表中后,我将它们进行混洗并按照0.8:0
2021-11-22 21:31:32 5.08MB JupyterNotebook
1
Kaggle 第三名解决方案 米哈伊尔·特罗菲莫夫、德米特里·乌里扬诺夫、斯坦尼斯拉夫·谢苗诺夫。 在私人排行榜上获得 0.0040 分 如何重现提交 不要忘记检查 ./src/set_up.py 中的路径! ./create_dirs.sh cd ./src ./main.sh cd ../ 并运行learning-main-model.ipynb 、 learning-4gr-only.ipynb 、 semi-supervised-trick.ipynb和final-submission-builder.ipynb 。 依赖关系 Python 2.7.9 Python 3.1.0 sklearn 0.16.1 麻木 1.9.2 熊猫 0.16.0 希克 1.1.1 pypy 2.5.1(安装了 joblib 0.8.4) scipy 0.15.1 xgboost
2021-11-22 20:16:40 227KB Python
1
Kaggle十大案例精讲课程,附课件+代码+数据。 课程特色: 1、精选kaggle初级案例,实战入门讲解。一步一脚印,十大案例精讲,案例知识点与代码交互讲解,让你快速突破R语言。 2、实战案例是最好的数据能力提升方式,本课程提供案例的数据集、代码以及老师讲解的PPT。 3、kaggle竞赛案例包含大量日常工作中的数据处理的方法,以及数据可视化的方法,助你突破数据工作的效率,对于数据处理、可视化、建模和模型评估有综合性显著性的提升,全方位的提升你的数据能力! 4、结合数据分析师的日常数据处理,建模的工作内容所需,融会贯通,通过案例教你如何成为一名数据分析师。 5、多种建模方法(随机森林、决策树、朴素贝叶斯、knn、支持向量机、 k均值聚类,模型融合方法等都有讲到,部分涉及原理简介)
2021-11-22 14:05:25 814B kaggle 数据分析
1
共享单车 我在 Kaggle 自行车共享需求竞赛中的尝试 文件描述和生成结果的执行顺序 clean_combine - 清理测试和训练数据集并将它们组合成单个 csv add_features - 添加回归算法使用的附加功能 Daily_trend_rf_​​split_predict - 使用随机森林来拟合注册用户和临时用户的每日总和,然后使用它来规范化数据,计算两个类别的典型工作日和工作日每小时趋势,并将它们组合在一起以对整个进行每小时预测2年时间跨度 回归分类器可以以任何顺序运行 4a. random_forest_hourly_predict - 使用随机森林和由天气等组成的特征来预测 rf 每日趋势预测的对数与实际计数的对数之间的差异 4b. gb_trees_hourly_predict - 使用梯度提升树和由天气等组成的特征来预测 rf 每日趋势预测的对数与实际计数的对数
2021-11-21 09:38:18 2.87MB Python
1
kaggle-bike-sharing-需求 我的 kaggle“游乐场”比赛代码
2021-11-21 09:34:04 192KB R
1
广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
项目背景:提供两年的每小时租金数据。训练集是每个月的前19天,而测试集是每月的20号到月底。必须仅使用租借期之前的可用信息来预测测试集涵盖的每个小时内租用的自行车总数。 一、载入数据 1.1收集数据 一般而言,数据由甲方提供。若甲方不提供数据,则需要根据相关问题从网络爬取,或者以问卷调查形式收集。本次共享单车数据分析项目数据源于Kaggle [https://www.kaggle.com/c/bike-sharing-demand/data]。 1.2 载入数据 // 载入工具包 import numpy as np import pandas as pd import matplotlib.
2021-11-18 15:53:48 186KB kaggle le 单车
1