这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:作者 Sanjiv Ranjan Das 是 Santa Clara 大学商学院金融与数据科学教授。这本书是作者为其课程《Machine Learning with R》开发整理的课堂笔记。 ◉ 目录: 数据科学的艺术 起步:数学基础 开源:R语言建模 更多:数据处理与其他 方差均值:马科维茨优化 从经验中学习:贝叶斯定理 自然语言:从新闻中提取信息 巴斯模型 提取维度:判别和因子分析 竞标:拍卖 截断和估计:有限的因变量 乘风破浪:傅里叶分析 建立联系:网络理论 统计大脑:神经网络 聚类分析和预测树
2022-12-31 12:25:25 4.29MB 人工智能 数据科学 算法 R语言
1
这是 ShowMeAI 持续分享的速查表系列!本系列速查表包含 200 多张知识卡片,分为『计算机科学』『机器学习』『计算机视觉和深度学习基础』『计算机视觉和深度学习精选专题』4个主题,用以回顾多年的 ML 研究、课程和学习中的所有内容,并为机器学习工程师的面试做准备。 这个文件是『计算机科学』主题(其他部分的下载链接见评论区),包含以下部分: PL Fundamentals(PL基础知识) Data Structures & Algorithms(数据结构和算法) Bit Manipulations(位操作) Time/Space Complexity(时间/空间复杂度)
1
SysIdentPy是一个Python系统模块,用于使用基于numpy构建的NARMAX模型进行系统识别,并根据3条款BSD许可进行分发。 该项目由Wilson RL Junior,Luan Pascoal C. Andrade和Samir AM Martins在系统识别学科的项目中启动。 塞缪尔(Samuel)于2019年初加入,此后做出了贡献。 文献资料 网站: : 例子 SysIdentPy现在支持NARX神经网络和常规估计器,例如sklearn估计器和Catboost。 范例 from torch import nn import numpy as np import pandas as pd import matplotlib . pyplot as plt from sysidentpy . metrics import mean_squared_error fro
1
Programming Projects in C for Students of Engineering, Science, and Mathematics 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
2022-11-24 19:25:43 4.19MB Programming Projects C Students
1
员工流失-原因和解释 留住人才与留住人才同等重要,而且可能会花更多的时间和金钱,这是因为花了一些时间和金钱来使某个工人适应您的环境和公司。 因此,我认为瞥一眼决定离开公司的工人的主要特征是我们值得的。 为了检查这一事实,我将使用位于Employee Attrition数据集,因为它包含专门为此用例收集的数据。 本研究中使用的版本也专门存储在文件夹data /中,因为网站上的文件可能会随着时间而变化,并且与此处所检查的版本不符。 档案结构 data / :分析中使用的数据集的版本。 doc / :由于具有嵌入式图形,因此使用HTML文档,并提供研究的结果和主要结论。 src / :项目中使用的代码,.Rmd格式。 参考
2022-11-23 20:08:46 1.75MB data-science machine-learning r ml
1
完善的机器学习:笔记,练习和Jupyter笔记本 在下面,您将找到补充第二版《机器学习精炼》(剑桥大学出版社出版)的一系列资源。 目录 小部件样本和我们的教学法 我们相信,只有对以下三个问题中的每一个回答都是肯定的,才能精通某种机器学习概念/主题。 Intuition你能用一个简单的图景描述这个想法吗? Mathematical derivation您可以用数学符号表达直觉并推导基础模型/成本函数吗? Implementation您可以在不使用高级库的情况下使用Python这样的编程语言对派生代码进行编码吗? Intuition comes first. 直观的飞跃先于知识的飞跃,因此,我们在书中包括了300多种彩色插图,这些彩色插图经过精心设计,可以直观地掌握技术概念。 这些插图中的许多是动画的快照,这些动画显示了某些算法的收敛性,某些模型从不完全拟合到过度拟合的演变等。可以使用动画(与静态图形相对)来最好地说明和理解此类概念。 您可以在此存储库中找到大量这样的动画-您也可以通过这些注释的原始Jupyter笔记本版本来修改自己。 这里只是几个例子: 交叉验证(回归)
1
Python数据科学:Python数据科学拥有位于http://youtube.comtheengineeringworld上的YouTube课程的所有数据集和jupyter笔记本文件,名称为“ Python数据科学课程”。
2022-11-17 10:37:57 1.83MB python data-science data machine-learning
1
Python应用数据科学 ## Python 数据科学简介
2022-11-07 22:05:26 31.15MB HTML
1
苏打SQL SQL可访问数据的数据测试,监视和分析。 苏打SQL有什么作用? 苏打SQL可让您 检测到不良数据时停止管道 通过超高效SQL提取指标和列配置文件 通过声明性配置文件完全控制指标和查询 为什么要使用苏打SQL? 为了防止数据的使用者遭受静默数据问题,最好的方法是分析和测试数据: 当它降落在您的仓库中时, 在每个重要的数据处理步骤之后 就在消费之前。 这样,您可以防止将不良数据传递给下游使用者。 您将花费更少的时间进行消防并获得更好的声誉。 苏打SQL如何工作? Soda SQL是一个命令行界面(CLI)和Python库,用于使用SQL测量和测试您的数据。 作为输入,Soda SQL使用YAML配置文件,其中包括: SQL连接详细信息 要计算什么指标 对测量进行哪些测试 基于这些配置文件,Soda SQL将执行扫描。 扫描将执行所有测量并运行与一个表关联的所
2022-11-07 14:20:52 195KB python data-science airflow data-engineering
1
Rachel Schutt, Cathy O'Neil-Doing Data Science_ Straight Talk from the Frontline-O'Reilly Media (2013)
2022-11-05 20:46:31 27.07MB 数据实战
1