使用AzureML进行心力衰竭预测 在此项目中,我们演示如何使用Azure ML Python SDK使用Azure AutoML和Hyperdrive服务来训练模型以预测由于心力衰竭导致的死亡率。 训练后,我们将部署最佳模型并通过使用它来评估模型端点。 项目设置与安装 若要设置此项目,我们需要访问Azure ML Studio。 项目设计的申请流程如下: 使用计算实例创建一个Azure ML工作区。 创建一个Azure ML计算群集。 从此资源库将心力衰竭预测数据集上载到Azure ML Studio。 将此存储库中附加的笔记本和脚本导入到Azure ML Studio中的“笔记本”部分。 笔记本中详细介绍了所有运行单元的说明。 数据集 概述 数据集用于评估心力衰竭患者的严重程度。 它包含2015年4月至12月在费萨拉巴德心脏病研究所和费萨拉巴德(巴基斯坦旁遮普)联合医院收集的
2021-12-19 11:13:46 79KB microsoft data-science machine-learning udacity
1
Alex Gorelik - The Enterprise Big Data Lake_ Delivering the Promise of Big Data and Data Science-O’Reilly Media (2019)
2021-12-18 15:56:05 10.56MB java
1
《数据科学原理(影印版 英文版)》旨在帮助你将数学、编程和商业分析这三者融会贯通。有了《数据科学原理(影印版 英文版)》,在面对复杂的问题时,无论是抽象和原始的数据统计,还是可实施的理念,你都会充满自信。   我们采用了一种独特的方法来建立起数学和计算机科学之间的桥梁,你会在这次令人兴奋的学习之旅中成长为一名数据科学家。从清洗和准备数据开始,然后到给出有效的数据挖掘策略和技术,你会经历数据科学的整个流程,建立起数据科学的各个组成部分是如何相互协作的宏观概念,学习基本的数学和统计学知识以及一些目前由数据科学家和分析师用到的伪代码。除此之外,你还将掌握机器学习,了解一些有用的统计模型,这些模型能够帮助你控制和处理*密集的数据集,学会如何创建出能股表达数据意图的可视化方法。
2021-12-18 09:20:50 6.84MB data science
1
EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型: randomForest,caret(用于数据拆分,交叉验证,预处理,特征选择,变量重要性估计等) 推荐模型: re荐 文本挖掘: tm,tidyverse
2021-12-17 12:54:13 26.84MB r random-forest clustering linear-regression
1
sl 用于概率预测的Python包 v0.0.2 安装 该软件包支持Python 3.6、3.7、3.8和3.9 通过PyPI安装 运行pip install pysloth 从存储库安装 使用SSH克隆回购git clone git@github.com:PySloth/pysloth.git 将目录更改为README.md (此文件)所在的位置,然后运行pip install . 快速开始 下面的代码示例显示了运行中的scpd和ccpd from pysloth import scpd_function , ccpd_function import numpy as np import statsmodels . api as sm np . random . seed ( 142 ) n = 1000 # training set m = int ( 0.8 * n ) #
2021-12-16 16:58:19 585KB python data-science machine-learning statistics
1
伦敦-scikit Data Science London 正在举办一场关于 Scikit-learn 的聚会。 本次比赛是尝试、分享和创建 sklearn 分类能力示例的练习场(如果这变成了有用的东西,我们可以跟进回归,或更复杂的分类问题)。 请参阅 Kaggle 网站
2021-12-15 21:05:25 2KB Python
1
乘客预测使用时间序列分析:我使用时间序列分析来预测公交车站乘客的行为和方式,数据可视化包括时间序列图
2021-12-14 20:52:36 3.7MB data-science machine-learning business ar
1
时空数据集 收集时空数据集以用于网络科学,深度学习和通用机器学习研究。 内容 匈牙利的水痘病例 描述 匈牙利每周水痘(儿童疾病)病例的时空数据集。 该数据集由一个县级邻接矩阵和2005年至2015年之间的县级报告病例的时间序列组成。有两个特定的相关任务: 县级病例数预测。 国家一级的病例数预测。 链接 特性 导演:没有。 节点功能:是。 时间的:是的。 匈牙利县 节点数 20 边缘 61 密度 0.3211 传递性 0.4134 可能的任务 计数数据回归 引用 @misc { rozemberczki2021chickenpox , title = { {Chickenpox Cases in Hungary: a Benchmark Dataset for Spatiotemporal Signal Processing with Graph Neural
1
d3js:使用D3.js进行实验
1
贷款批准预测:贷款申请数据分析
2021-12-12 19:12:57 179KB python data-science machine-learning data-mining
1