EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型: randomForest,caret(用于数据拆分,交叉验证,预处理,特征选择,变量重要性估计等) 推荐模型: re荐 文本挖掘: tm,tidyverse
2021-12-17 12:54:13 26.84MB r random-forest clustering linear-regression
1
sl 用于概率预测的Python包 v0.0.2 安装 该软件包支持Python 3.6、3.7、3.8和3.9 通过PyPI安装 运行pip install pysloth 从存储库安装 使用SSH克隆回购git clone git@github.com:PySloth/pysloth.git 将目录更改为README.md (此文件)所在的位置,然后运行pip install . 快速开始 下面的代码示例显示了运行中的scpd和ccpd from pysloth import scpd_function , ccpd_function import numpy as np import statsmodels . api as sm np . random . seed ( 142 ) n = 1000 # training set m = int ( 0.8 * n ) #
2021-12-16 16:58:19 585KB python data-science machine-learning statistics
1
伦敦-scikit Data Science London 正在举办一场关于 Scikit-learn 的聚会。 本次比赛是尝试、分享和创建 sklearn 分类能力示例的练习场(如果这变成了有用的东西,我们可以跟进回归,或更复杂的分类问题)。 请参阅 Kaggle 网站
2021-12-15 21:05:25 2KB Python
1
乘客预测使用时间序列分析:我使用时间序列分析来预测公交车站乘客的行为和方式,数据可视化包括时间序列图
2021-12-14 20:52:36 3.7MB data-science machine-learning business ar
1
时空数据集 收集时空数据集以用于网络科学,深度学习和通用机器学习研究。 内容 匈牙利的水痘病例 描述 匈牙利每周水痘(儿童疾病)病例的时空数据集。 该数据集由一个县级邻接矩阵和2005年至2015年之间的县级报告病例的时间序列组成。有两个特定的相关任务: 县级病例数预测。 国家一级的病例数预测。 链接 特性 导演:没有。 节点功能:是。 时间的:是的。 匈牙利县 节点数 20 边缘 61 密度 0.3211 传递性 0.4134 可能的任务 计数数据回归 引用 @misc { rozemberczki2021chickenpox , title = { {Chickenpox Cases in Hungary: a Benchmark Dataset for Spatiotemporal Signal Processing with Graph Neural
1
d3js:使用D3.js进行实验
1
贷款批准预测:贷款申请数据分析
2021-12-12 19:12:57 179KB python data-science machine-learning data-mining
1
NBA预测 使用Python中的Logistic回归模型预测NBA比赛 模型 该模型使用从stats.nba.com刮取的八个因素来确定NBA游戏的预测结果。 每个统计数据都调整为每100个回合,以确保速度不会影响预测。 主队 胜率 篮板 营业额 正负 进攻等级 防守等级 真实投篮命中率 用法 安装 pip3 install -r requirements.txt 每日预测 打开nbaPredict.py 编辑对makeInterpretPrediction的调用,其中包含所需的比赛日期,赛季以及赛季的开始日期 通过终端或IDE运行程序 等待约1-3分钟,模型即可完成抓取统计信息并预测结果 输出结果作为主队击败客队的机会百分比 过去的预测 打开makePastPredictions.py 使用所需的开始日期,结束日期,季节,季节的开始日期和输出文件名来编辑对makePastPredictions的调用。 注意:开始日期应至少在季节开始后三天,且结束日期不包括在内。 通过终端或IDE运行程序 两个CSV文件将保存在Data文件夹中。 一个保存游戏数据,另一个保存游戏的预测。
2021-12-12 17:09:42 441KB python nba data-science model
1
Helstrom量子质心分类器 Helstrom量子质心(HQC)分类器是一种受量子启发的监督分类方法,用于具有二进制类的数据(即,仅具有2类的数据)。 受到量子启发的意思是指采用和利用量子理论的分类过程。 它受到可观察到的量子Helstrom的启发,该量子行为作用于量子模式之间的可区分性,而不是数据集的经典模式。 HQC分类器基于Giuseppe Sergioli,Roberto Giuntini和Hector Freytes在他们的论文中进行的研究: Sergioli G, Giuntini R, Freytes H (2019) A new quantum approach to
2021-12-11 01:13:27 26KB python classifier data-science machine-learning
1
罗斯·曼·卡格 使用监督学习模型和时间序列分析,可以预测Rossmann药店的未来6周销售情况。 应用了所有数据科学步骤,包括数据清理,探索性数据分析,数据准备,创建机器学习模型,性能分析(MAE,MAPE,RMSE)以及使用Flask和Heroku部署到云中。
1