不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包
2023-02-13 20:23:36 314KB python data-science machine-learning statistics
1
edX数据科学微型硕士 每个课程的问题和笔记本将在此存储库中的相应文件夹中备份。 该存储库包含以下文件夹: 机器学习 python-for-data-analysis 大数据分析使用火花 使用Python的概率和统计 后期制作视频的位置: 按以下演示者的名称进行组织: : 要使用reveal.js克隆此存储库: 运行git clone --recursive https://github.com/ucsd-edx/edX-Micro-Master-in-Data-Science.git Jupyter笔记本电脑的安装说明。 要在计算机上安装jupyter,请按照以下说明进行操作: ://mas-dse.github.io/startup/ 要点安装一堆nbextensions,以及用于这些扩展的配置程序,请查看: : nbgrader Matt和Shweta在此处添加
2023-02-08 12:19:08 140.44MB JupyterNotebook
1
Python Data Science Handbook[美]Jake VanderPlas【高清版】,PDF
2023-01-22 21:53:45 18.44MB python 数据分析 数据科学 数据处理
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:作者 Sanjiv Ranjan Das 是 Santa Clara 大学商学院金融与数据科学教授。这本书是作者为其课程《Machine Learning with R》开发整理的课堂笔记。 ◉ 目录: 数据科学的艺术 起步:数学基础 开源:R语言建模 更多:数据处理与其他 方差均值:马科维茨优化 从经验中学习:贝叶斯定理 自然语言:从新闻中提取信息 巴斯模型 提取维度:判别和因子分析 竞标:拍卖 截断和估计:有限的因变量 乘风破浪:傅里叶分析 建立联系:网络理论 统计大脑:神经网络 聚类分析和预测树
2022-12-31 12:25:25 4.29MB 人工智能 数据科学 算法 R语言
1
SysIdentPy是一个Python系统模块,用于使用基于numpy构建的NARMAX模型进行系统识别,并根据3条款BSD许可进行分发。 该项目由Wilson RL Junior,Luan Pascoal C. Andrade和Samir AM Martins在系统识别学科的项目中启动。 塞缪尔(Samuel)于2019年初加入,此后做出了贡献。 文献资料 网站: : 例子 SysIdentPy现在支持NARX神经网络和常规估计器,例如sklearn估计器和Catboost。 范例 from torch import nn import numpy as np import pandas as pd import matplotlib . pyplot as plt from sysidentpy . metrics import mean_squared_error fro
1
员工流失-原因和解释 留住人才与留住人才同等重要,而且可能会花更多的时间和金钱,这是因为花了一些时间和金钱来使某个工人适应您的环境和公司。 因此,我认为瞥一眼决定离开公司的工人的主要特征是我们值得的。 为了检查这一事实,我将使用位于Employee Attrition数据集,因为它包含专门为此用例收集的数据。 本研究中使用的版本也专门存储在文件夹data /中,因为网站上的文件可能会随着时间而变化,并且与此处所检查的版本不符。 档案结构 data / :分析中使用的数据集的版本。 doc / :由于具有嵌入式图形,因此使用HTML文档,并提供研究的结果和主要结论。 src / :项目中使用的代码,.Rmd格式。 参考
2022-11-23 20:08:46 1.75MB data-science machine-learning r ml
1
完善的机器学习:笔记,练习和Jupyter笔记本 在下面,您将找到补充第二版《机器学习精炼》(剑桥大学出版社出版)的一系列资源。 目录 小部件样本和我们的教学法 我们相信,只有对以下三个问题中的每一个回答都是肯定的,才能精通某种机器学习概念/主题。 Intuition你能用一个简单的图景描述这个想法吗? Mathematical derivation您可以用数学符号表达直觉并推导基础模型/成本函数吗? Implementation您可以在不使用高级库的情况下使用Python这样的编程语言对派生代码进行编码吗? Intuition comes first. 直观的飞跃先于知识的飞跃,因此,我们在书中包括了300多种彩色插图,这些彩色插图经过精心设计,可以直观地掌握技术概念。 这些插图中的许多是动画的快照,这些动画显示了某些算法的收敛性,某些模型从不完全拟合到过度拟合的演变等。可以使用动画(与静态图形相对)来最好地说明和理解此类概念。 您可以在此存储库中找到大量这样的动画-您也可以通过这些注释的原始Jupyter笔记本版本来修改自己。 这里只是几个例子: 交叉验证(回归)
1
Python数据科学:Python数据科学拥有位于http://youtube.comtheengineeringworld上的YouTube课程的所有数据集和jupyter笔记本文件,名称为“ Python数据科学课程”。
2022-11-17 10:37:57 1.83MB python data-science data machine-learning
1
Python应用数据科学 ## Python 数据科学简介
2022-11-07 22:05:26 31.15MB HTML
1
苏打SQL SQL可访问数据的数据测试,监视和分析。 苏打SQL有什么作用? 苏打SQL可让您 检测到不良数据时停止管道 通过超高效SQL提取指标和列配置文件 通过声明性配置文件完全控制指标和查询 为什么要使用苏打SQL? 为了防止数据的使用者遭受静默数据问题,最好的方法是分析和测试数据: 当它降落在您的仓库中时, 在每个重要的数据处理步骤之后 就在消费之前。 这样,您可以防止将不良数据传递给下游使用者。 您将花费更少的时间进行消防并获得更好的声誉。 苏打SQL如何工作? Soda SQL是一个命令行界面(CLI)和Python库,用于使用SQL测量和测试您的数据。 作为输入,Soda SQL使用YAML配置文件,其中包括: SQL连接详细信息 要计算什么指标 对测量进行哪些测试 基于这些配置文件,Soda SQL将执行扫描。 扫描将执行所有测量并运行与一个表关联的所
2022-11-07 14:20:52 195KB python data-science airflow data-engineering
1