巧克力条评级数据集的探索性数据分析 s 柏林阿西杜 芭芭拉·阿萨玛 本尼迪克·纳蒂 别林达·奥塞图图 介绍 探索性数据分析(EDA)是数据科学项目中最关键的步骤之一。 EDA的基本术语是“借助可视化和描述性统计数据了解数据”的一种方式。 巧克力是可可可粉经过烘焙和磨碎的制剂,以液体,糊状或块状形式制成,也可以在其他食品中用作调味成分。 巧克力是全世界儿童和成人喜爱的糖果。 巧克力基本上是由可可和其他一些添加剂制成的。 这些数据的探索将基于数据分析周期:了解数据,提出问题,提出假设,数据清理,数据分析,发现和建议。 该报告详细说明了分析Chocolate Bar Ratings数据集所使用的步骤和过程。 这是对来自世界各地的1795块巧克力条的分析。 从数据中,我们将查看巧克力棒的各种制造地点,可可豆的原产国和总体评级以及其他各种其他信息。 数据来自曼哈顿巧克力协会的布雷迪·布雷林斯基。
2022-03-29 11:40:00 2.51MB JupyterNotebook
1
svm-gpu 适用于带GPU的多类支持向量机(SVM)库。 这是一种快速且可靠的分类算法,在有限的数据量下性能很好。 支持向量机 : 支持向量机是有监督的学习模型,可以分析数据并识别模式。 一个特殊的特性是,它们同时最小化了经验分类误差并最大化了几何余量。 因此,它们也被称为最大余量分类器。 支持向量机的优点是: 在高维空间有效。 在维数大于样本数的情况下仍然有效。 在决策函数中使用训练点的子集(称为支持向量),因此它也可以提高存储效率。 多功能:可以为决策功能指定不同的内核功能。 提供了通用内核,但是也可以指定自定义内核。 与神经网络相比,在有限数量的样本(数千个样本)中实现了更高的速度和更好的性能 支持向量机的缺点包括: 如果特征数量远大于样本数量,则在选择内核函数时应避免过度拟合,并且正则化项至关重要。 SVM不直接提供概率估计,而是使用昂贵的五重交叉验证来计
2022-03-29 11:08:04 113KB JupyterNotebook
1
评分预测器 是否提供基于评论的机器学习模型,该模型可以预测评论的等级并检查其等级。
2022-03-28 20:24:31 827KB JupyterNotebook
1
mpld3:Matplotlib的D3查看器 维护者: 和 作者:杰克· Jake Vanderplas) 许可:BSD 3子句 这是一个基于D3js的交互式查看器,将matplotlib图形引入浏览器。 请访问以获取文档和示例。 您可能还会在该存储库的notebooks目录中看到或。 关于 mpld3提供了一个基于D3的自定义独立javascript库,该库可解析绘图的JSON表示形式。 mpld3 python模块提供了一组例程(使用框架)解析matplotlib图并输出mpld3.js可读的JSON描述。 安装 mpld3与python 2.6-2.7和3.3-3.4兼容。 它需要 2.2.2版和 2.7+版。 可选地,mpld3可以与 Notebook一起使用,并且需要IPython版本1.x或(最好)版本2.0+。 该软件包基于框架,用于爬网和导出matplotlib映
2022-03-28 15:12:52 2.15MB JupyterNotebook
1
葡萄酒质量数据集 这两个数据集包含两种不同的特性,分别是两种不同葡萄酒(红葡萄酒和白葡萄酒)的理化特性和感官特性,该产品称为“ Vinho Verde”。 数据来自。 数据集中有1599个红酒样品和4898个白葡萄酒样品。 每个葡萄酒样本(行)具有以下特征(列): 固定酸度 挥发性酸度 柠檬酸 残留糖 氯化物 游离二氧化硫 二氧化硫总量 密度 pH值 硫酸盐 酒精 质量(得分在0到10之间) 研究背景是对数据尝试不同的预测算法并检查结果。
2022-03-28 10:51:53 536KB JupyterNotebook
1
Udacity-机器学习入门 安然传奇 安然(Enron)丑闻是财务丑闻,最终导致安然公司(Enron Corporation)破产,该公司位于德克萨斯州休斯敦的美国能源公司,实际上是阿瑟·安徒生(Arthur Andersen)的解散,后者是美国五大审计和会计合伙企业之一世界。 除了是当时美国历史上最大的破产重组外,安然还被认为是最大的审计失败。 安然公司由肯尼思·莱(Kenneth Lay)于1985年合并休斯顿天然气公司和InterNorth公司后成立。 几年后,当杰弗里·斯基林(Jeffrey Skilling)被聘用时,他培养了一批高管人员,这些人员通过使用会计漏洞,特殊目的实体以及不良的财务报告,能够从失败的交易和项目中隐藏数十亿美元的债务。 首席财务官安德鲁·法斯托(Andrew Fastow)和其他高管不仅误导了安然公司董事会和审计委员会关于高风险会计的作法,而且还向亚瑟
2022-03-27 16:17:44 2.48MB JupyterNotebook
1
docker环境构筑方法&& quatsコンペ用ファイル构成 ファイル说明 Dockerfile:元となる内核映像に必要なライブラリ(python关系及び必要であればtmuxなどのapt-get关系)をインストールするためのもの。 docker-compose.yml:コンコの开始时における引数をまとめたもの。コンテナ外のフォルダをマウントしてファイルとして保存できるなど结构便利。 ファイル构成work_dir / ┠QUANTS_DATA_DIR(コンデのタセータセットを入れるフォルgit。gitのカレントディレクトリの范囲外) s Quants(gitでcloneしてくる中身)というようにしておくこと。上记を守っておくと,docker-compose.ymlの中身を书き换えなくて済む。 码头工人コンテナ起动手顺 docker build -tquants_forecast。 码头
2022-03-25 20:34:13 2.42MB JupyterNotebook
1
使用TensorFlow-2.0进行深度学习 使用Tensorflow 2.0从零开始实现自己的深度学习模型 这是由发布的的代码存储库。 它包含从头到尾完成视频课程所需的所有支持项目文件。 关于视频课程 您是否渴望深入研究神经网络的细节,并愿意尝试使用它? 您是否想学习深度学习技术,以使用最新的Tensorflow 2.0构建项目。 您可以使用Keras,但这是一个高级实现,它本身在后端使用Tensorflow,并且在TensorflowKeras之前,您无法在模型中进行最高级别的更改。 一位优秀的数据科学家必须具备幕后运作方式的技能。 本课程将通过提供Tensorflow 2.0的实践知识,帮助您成为一名优秀的数据科学家。 您将实现真正的深度学习算法,并将在所有实现中使用。 使用实现,您将学习神经网络的核心细节,例如正向传播,即如何初始化权重和反向传播,即如何使用梯度下降算法更新权重,成
2022-03-25 19:01:16 112.11MB JupyterNotebook
1
MEEO_AWS_SENTINEL-5P Jupyter笔记本和相关文档,用于处理存储在AWS S3存储桶S3:// meeo-s5p中的Sentinel-5P 2级数据 要求 以下是有关运行notbook的软件要求的一些详细信息。 Python 3和库 此处包含的笔记本使用Python 3和以下库: boto3 。 用于以编程方式使用AWS的库 netcdf4 。 用于读取netcdf文件格式的库。 盖达尔地理空间数据抽象库 卡托普具有Matplotlib支持以可视化的制图python库。 光栅。 Rasterio是用于栅格处理的非常有用的模块,可用于在Python中读取和写入几种不同的栅格格式。 这取决于gdal。 Sentinel-5p数据 可以在浏览存储在AWS上的Sentinel-5P数据。 概括 该数据集包含从Sentinel-5P卫星的观测结果生成的2级产品。 Sen
2022-03-25 18:37:47 421KB JupyterNotebook
1
wwu-ki_brainage 使用卷积神经网络(CNN)进行大脑年龄预测的教程 培训和评估是使用fastai_scans( )完成的,fastai是与3d医学图像配合使用的fastai扩展。 安装 1.)创建一个新的conda环境,安装Python 3.6并激活它 conda create -n wwuki_brainage python=3.6; conda activate wwuki_brainage 2.)在环境中安装pip conda install pip 3.)使用pip在该conda环境中安装软件包(将USER替换为您的用户名,将CONDA_DIR替换为.conda替换为Anaconda,将miniconda替换为miniconda)。 /home/USER/CONDA_DIR/envs/wwuki_brainage/bin/pip install git+git
2022-03-25 14:33:17 19.78MB JupyterNotebook
1