Stat-140SL-最终项目-澳大利亚-天气 包含与Stats 140SL最终项目有关的文件的回购,我们的目标是利用推论统计方法来预测澳大利亚的降雨。 数据来自Kaggle,可以在以下位置找到: :
2021-06-20 22:24:17 3.69MB
1
使用机器学习的信用卡欺诈检测 信用卡欺诈是一个日益严重的问题,面临许多挑战,包括时间漂移和严重的阶级失衡。 该项目尝试使用包括自适应合成采样方法(ADASYN)和合成少数采样率(SMOTE)在内的最新技术来解决班级不平衡问题。 2013年9月在欧洲进行的超过280k真实交易[1]被用作训练数据集。 比较了三种类型的机器学习模型:随机森林,支持向量机和多层感知器。 结果表明,不平衡数据集的最佳采样方法取决于数据集和所使用的模型。 该项目包含以下组件: a)PDF格式的IEEE风格论文 b)Jupyter Notebook进行了机器学习测试。 您可以运行视图并自己运行它们。 还包括注释,推理和数字。 为了方便起见,我在此git repo中包含了原始数据集的副本[1],但是请参考原始资源以获取最新版本。 该项目是2017年冬季在滑铁卢大学进行的SYDE 522:机器学习的一部分。 安装 克隆项目: $ git clone https://github.com/yazanobeidi/fraud-detection.git && cd fraud-detection Pip安装依赖项
2021-06-20 21:58:01 69.56MB machine-learning scikit-learn card kaggle
1
Kaggle | 网络流量预测
2021-06-19 11:48:18 922KB Python开发-网络编程
1
video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle
2021-06-17 16:02:23 381KB kaggle videogamesales 数据集 数据分析
1
kaggle Home_credit 信贷风控 train训练字段的Flink sql 预处理
2021-06-15 13:07:28 12KB Flinksql
卡格莱雨 关于 kaggle 比赛的解决方案,在排行榜上得分约为 0.00775。 要重现结果,请先运行“preprocess.py”,然后运行“classif_model.py” 原始数据转换 来自原始数据的每个样本都提供了这段时间内雷达测量的序列,因此对于每个样本和每个测量,我计算了一段时间内的一些聚合(平均值、最小值、最大值、50% 百分位数、标准差)。 这一步在实现 初步分析 您可以在找到对预处理数据的一些主要分析 模型 这一步在实现 直觉 对于模型评估,使用,根据该,我需要预测从 0 到 69 的降雨量的累积概率。 我认为这是一个多类分类问题。 为了首先建立累积概率,我需要预测以下每个雨量计范围的概率:0, (0, 1], (1, 2], ..., (68, 69], (69, +inf))。总共有 71 个范围,所以这是一个有 71 个类别的分类任务。 有些类非常小(频率
2021-06-14 20:03:05 1.44MB Python
1
kaggle交通数据集,共600+MB
2021-06-12 14:07:34 611.85MB 机器学习 kaggle 交通数据集
1
kaggle人脸数据集,共60+MB,用于资源分享
2021-06-12 14:07:33 60.32MB kaggle 机器学习 fer2013
1
心脏疾病数据集的数据分析 我在Kaggle网站心脏病数据集上使用R进行了数据分析。 可在此处获取分析的pdf版本。 如果有问题,请发表评论,并帮助我改善代码并学得更好。 该分析包含:单变量分析,PCA和聚类
2021-06-10 12:50:08 18.59MB HTML
1
Week4_GlobalForecast_COVID19 一个协作存储库,其中包含第4周Kaggle竞赛的全球COVID-19预测代码( ) 预测/预测主要使用InterpretML库完成,以查看所选要素之间的相关性。 要查看结果,请确保你已经安装了所有必需的包requirements.txt ,并运行experimental.ipynb从笔记本电脑的文件夹中。
2021-06-10 10:49:19 7.26MB JupyterNotebook
1