本文件是博客中的介绍代码的运行代码。 环境:python3.7+keras2.3.1+tensorflow1.15.0+sklearn0.22.1+matplotlib3.1.1 三方库:mglearn0.1.7
2022-11-07 19:22:04 253KB 神经网络 机器学习
1
苏打SQL SQL可访问数据的数据测试,监视和分析。 苏打SQL有什么作用? 苏打SQL可让您 检测到不良数据时停止管道 通过超高效SQL提取指标和列配置文件 通过声明性配置文件完全控制指标和查询 为什么要使用苏打SQL? 为了防止数据的使用者遭受静默数据问题,最好的方法是分析和测试数据: 当它降落在您的仓库中时, 在每个重要的数据处理步骤之后 就在消费之前。 这样,您可以防止将不良数据传递给下游使用者。 您将花费更少的时间进行消防并获得更好的声誉。 苏打SQL如何工作? Soda SQL是一个命令行界面(CLI)和Python库,用于使用SQL测量和测试您的数据。 作为输入,Soda SQL使用YAML配置文件,其中包括: SQL连接详细信息 要计算什么指标 对测量进行哪些测试 基于这些配置文件,Soda SQL将执行扫描。 扫描将执行所有测量并运行与一个表关联的所
2022-11-07 14:20:52 195KB python data-science airflow data-engineering
1
Python heapq 详解 Python有一个内置的模块,heapq标准的封装了最小堆的算法实现。下面看两个不错的应用。 小顶堆(求TopK大) 话说需求是这样的: 定长的序列,求出TopK大的数据。 import heapq import random class TopkHeap(object): def __init__(self, k): self.k = k self.data = [] def Push(self, elem): if len(self.data) < self.k: heapq.heappush(self.data
2022-11-06 12:45:13 34KB data eap python
1
Rachel Schutt, Cathy O'Neil-Doing Data Science_ Straight Talk from the Frontline-O'Reilly Media (2013)
2022-11-05 20:46:31 27.07MB 数据实战
1
Data scientist has been called “the sexiest job of the 21st century,” presumably by someone who has never visited a fire station. Nonetheless, data science is a hot and growing field, and it doesn’t take a great deal of sleuthing to find analysts breathlessly prognosticating that over the next 10 years, we’ll need billions and billions more data scientists than we currently have.
2022-11-05 20:25:26 5.77MB python
1
本数据集为机器学习算法学习和模型验证的典型数据集,可用作机器学习回归问题的分析验证
1
我的沙鼠,依ugg和金吉可以跑多远? 红外传感器里程表,带有ePaper显示的每日统计数据。
2022-11-05 19:26:35 214KB animals data collection
1
nlp-data-augmentation:用于NLP的数据增强。 NLP数据增强
2022-11-05 14:52:43 3.18MB nlp data-augmentation Naturallanguageprocessing
1
Kernel Entropy Component Analysis,KECA方法的作者R. Jenssen自己写的MATLAB代码,文章发表在2010年5月的IEEE TPAMI上面
1
Linear Algebra and Learning from data by Gilbert Strange pdf
2022-11-03 19:24:30 24.05MB machinglearning data linearalgebra
1