概述 数据集成变得简单,安全和可扩展。 新的开源标准可将数据从应用程序,API和数据库同步到仓库,湖泊和其他目的地。 Airbyte的使命是使数据集成管道成为一种商品。 您可以在几分钟内使用免维护的连接器。 只需对源和仓库进行身份验证,并获得适合您的架构和API更改的连接器。 构建新的连接器变得微不足道。 通过提供计划和编排,我们可以使用您选择的语言轻松添加所需的新连接器。 设计用于覆盖连接器的长尾巴和需求。 从社区经过测试的连接器中受益,并使它们适应您的特定需求。 您的数据保留在云中。 完全控制您的数据以及数据传输成本。 由于Airbyte是自托管的,因此不再需要执行任何安全合规性过程。 正如基于云的解决方案所提供的那样,不再需要按批量计价。 这是我们的的列表。 快速开始 git clone https://github.com/airbytehq/airbyte.gi
2023-02-28 14:27:40 13.85MB open-source data-science data integration
1
在Tensorflow中使用记忆增强神经网络进行一枪学习。 更新:添加了对Tensorflow v1 *的支持。 本文采用记忆增强神经网络的一站式学习的Tensorflow实现。 目前的执行进度: 实用功能: 图像处理器 指标(精度) 相似度(余弦相似度) LSTM控制器和存储单元 批处理发生器 Omniglot测试人员代码 通过自动编码器进行无监督功能学习 牛/新出生识别 基准数据集是。 所有数据集都应放置在文件夹中。 亚当·桑托罗,谢尔盖Bartunov,马修Botvinick,大安Wierstra,蒂莫西Lillicrap,一次性学习与记忆,增强神经网络,[ ]
1
不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包
2023-02-13 20:23:36 314KB python data-science machine-learning statistics
1
edX数据科学微型硕士 每个课程的问题和笔记本将在此存储库中的相应文件夹中备份。 该存储库包含以下文件夹: 机器学习 python-for-data-analysis 大数据分析使用火花 使用Python的概率和统计 后期制作视频的位置: 按以下演示者的名称进行组织: : 要使用reveal.js克隆此存储库: 运行git clone --recursive https://github.com/ucsd-edx/edX-Micro-Master-in-Data-Science.git Jupyter笔记本电脑的安装说明。 要在计算机上安装jupyter,请按照以下说明进行操作: ://mas-dse.github.io/startup/ 要点安装一堆nbextensions,以及用于这些扩展的配置程序,请查看: : nbgrader Matt和Shweta在此处添加
2023-02-08 12:19:08 140.44MB JupyterNotebook
1
Python Data Science Handbook[美]Jake VanderPlas【高清版】,PDF
2023-01-22 21:53:45 18.44MB python 数据分析 数据科学 数据处理
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:作者 Sanjiv Ranjan Das 是 Santa Clara 大学商学院金融与数据科学教授。这本书是作者为其课程《Machine Learning with R》开发整理的课堂笔记。 ◉ 目录: 数据科学的艺术 起步:数学基础 开源:R语言建模 更多:数据处理与其他 方差均值:马科维茨优化 从经验中学习:贝叶斯定理 自然语言:从新闻中提取信息 巴斯模型 提取维度:判别和因子分析 竞标:拍卖 截断和估计:有限的因变量 乘风破浪:傅里叶分析 建立联系:网络理论 统计大脑:神经网络 聚类分析和预测树
2022-12-31 12:25:25 4.29MB 人工智能 数据科学 算法 R语言
1
SysIdentPy是一个Python系统模块,用于使用基于numpy构建的NARMAX模型进行系统识别,并根据3条款BSD许可进行分发。 该项目由Wilson RL Junior,Luan Pascoal C. Andrade和Samir AM Martins在系统识别学科的项目中启动。 塞缪尔(Samuel)于2019年初加入,此后做出了贡献。 文献资料 网站: : 例子 SysIdentPy现在支持NARX神经网络和常规估计器,例如sklearn估计器和Catboost。 范例 from torch import nn import numpy as np import pandas as pd import matplotlib . pyplot as plt from sysidentpy . metrics import mean_squared_error fro
1
员工流失-原因和解释 留住人才与留住人才同等重要,而且可能会花更多的时间和金钱,这是因为花了一些时间和金钱来使某个工人适应您的环境和公司。 因此,我认为瞥一眼决定离开公司的工人的主要特征是我们值得的。 为了检查这一事实,我将使用位于Employee Attrition数据集,因为它包含专门为此用例收集的数据。 本研究中使用的版本也专门存储在文件夹data /中,因为网站上的文件可能会随着时间而变化,并且与此处所检查的版本不符。 档案结构 data / :分析中使用的数据集的版本。 doc / :由于具有嵌入式图形,因此使用HTML文档,并提供研究的结果和主要结论。 src / :项目中使用的代码,.Rmd格式。 参考
2022-11-23 20:08:46 1.75MB data-science machine-learning r ml
1
完善的机器学习:笔记,练习和Jupyter笔记本 在下面,您将找到补充第二版《机器学习精炼》(剑桥大学出版社出版)的一系列资源。 目录 小部件样本和我们的教学法 我们相信,只有对以下三个问题中的每一个回答都是肯定的,才能精通某种机器学习概念/主题。 Intuition你能用一个简单的图景描述这个想法吗? Mathematical derivation您可以用数学符号表达直觉并推导基础模型/成本函数吗? Implementation您可以在不使用高级库的情况下使用Python这样的编程语言对派生代码进行编码吗? Intuition comes first. 直观的飞跃先于知识的飞跃,因此,我们在书中包括了300多种彩色插图,这些彩色插图经过精心设计,可以直观地掌握技术概念。 这些插图中的许多是动画的快照,这些动画显示了某些算法的收敛性,某些模型从不完全拟合到过度拟合的演变等。可以使用动画(与静态图形相对)来最好地说明和理解此类概念。 您可以在此存储库中找到大量这样的动画-您也可以通过这些注释的原始Jupyter笔记本版本来修改自己。 这里只是几个例子: 交叉验证(回归)
1
Python数据科学:Python数据科学拥有位于http://youtube.comtheengineeringworld上的YouTube课程的所有数据集和jupyter笔记本文件,名称为“ Python数据科学课程”。
2022-11-17 10:37:57 1.83MB python data-science data machine-learning
1