一个从开源项目 MLPrimitives 机器学习和数据科学的管道和原语。 文档: : Github: : 执照: 开发状态: 概述 此存储库包含 MLBlocks 库要使用的原始注释,以及必要的 Python 代码,以使其中一些与 MLBlocks API 要求完全兼容。 还有一组直接贡献给这个库的自定义原语,它们要么结合第三方工具,要么从头开始实现新功能。 我们为什么要创建这个库? 在一个快速发展的领域中有太多的图书馆 构建机器学习应用程序的巨大社会需求 领域专业知识存在于多个地方(数学知识) 没有关于超参数、行为的文档化信息...... 安装 要求 MLPrimitives已在Python 3.6、3.7和3.8上进行开发和测试 此外,虽然不是严格要求,但强烈建议使用virtualenv以避免干扰运行MLPrimitives的系统中安装的其他软件。 使用
1
数据科学学习手札139)geopandas 0.11版本重要新特性一览.doc
2022-07-11 14:08:29 581KB 技术资料
数据科学研讨会 这是出版的的资料库。 它包含从头到尾完成该课程所必需的所有支持项目文件。 要求和设置 要开始使用项目文件,您需要: 设定 关于数据科学研讨会 为您提供了开始从事各种数据科学项目所需的基本技能。 本书将逐步介绍数据科学项目的基本组成部分,然后将所有部分放在一起以巩固您的知识并在现实世界中应用您的知识。 您将学到什么 探索有监督学习与无监督学习之间的主要区别 使用scikit-learn和pandas库处理和分析数据 了解关键概念,例如回归,分类和聚类 探索先进的技术来提高模型的准确性 了解如何加快添加新功能的过程 简化您的机器学习工作流程以进行生产 相关工作坊 如果您发现此存储库很有用,则可能需要查看我们的其他一些研讨会标题: 应用TensorFlow和Keras研讨会
2022-07-06 18:43:48 160.03MB python machine-learning random-forest regression
1
大数据工程师路线图 数据工程师路线图 深度学习路线图 机器学习路线图 数据科学家路线图 从以下几个方面着手讲解:数据科学家、机器学习、深度学习、数据工程师以及大数据工程师。这 5 部分内容都有详细的学习路线图
MATLAB白细胞计数代码支持数据科学练习 数据集support.tsv包含来自SUPPORT(了解预后偏好结果和治疗风险的研究)的1000名重症住院成年人的随机样本。 使用数据集,开发一个预测医院死亡的模型。 请提供用于开发模型的任何代码,对结果的简短讨论以及在处理数据时所做的任何假设或简化。 您可以使用任何开源语言(例如R,Python,Julia)开发解决方案。 在使用专有软件(例如SAS,Stata,MATLAB)之前,请先与我们联系。 名称 标签 年龄 年龄 死亡 截至NDI日期(1994年12月31日)之前的任何时间死亡 性别 性别 医院死亡 住院死亡 斯洛 从研究进入到出院的日期 时间 随访天数 dzgroup 诊断组(分类) dzclass 诊断类(分类) num.co 合并症数 教育 受教育年限 收入 收入(分类) 斯科马 支持基于格拉斯哥D3的昏迷评分 收费 住院费用 托斯特 RCC总费用 托姆斯特 总微成本 Avtisst 平均TISS,第3-25天 种族 种族(分类) 吝啬的 平均动脉血压(第3天) 世界银行 白细胞计数(第3天) rt 心率(第3天) 回应 呼
2022-06-27 15:55:15 57KB 系统开源
1
农业对每个人都很重要,因为它在我们的日常生活中很重要。 耕种对我们所有人来说都是宝贵的,是建设健康的农业系统发展所必需的,在这种情况下,不同的技术以及新兴的农业信息学也起着主导作用。 关于发展现代农业系统,各种方法是有用的并且正在增强。 除了核心技术外,各种支持技术也有利于农业生产和系统实践的现代化。 在基因工程,计算机技术,纳米科学,管理科学等领域,很少有重要的技术。 信息技术和农业科学导致了农业信息学及其各个组成部分的发展。 最近,开发了各种其他组件。 数据分析,人工智能和机器人技术,云计算和虚拟化,物联网等。在这些技术中,大数据和分析技术正在不断涌现,并在农业信息学上得到了进一步的增强,因为它拥有有效管理大量数据的解决方案,并且复杂的数据。 数据科学,大数据或分析在不同学科中的应用导致了各种各样的新术语,其中农业数据科学是重要的一门。 本文涉及农业信息学,包括功能,强调大数据的应用程序和分析。 本文讨论了有关农业数据科学的问题,即农业中的大数据和分析的可能性以及可用的教育计划和未来的潜力。 本文还阐述了这方面的挑战,问题等。
2022-06-21 21:59:54 255KB Agricultural Information Technology Emerging
1
2022数据科学峰会资料合集(38份).zip
2022-06-05 15:06:44 162.96MB 文档资料 2022数据科学峰会
探索性数据分析-汽车数据集 UCI机器学习存储库 资料来源: : 该项目涉及两个主要分析: 汽车符号值与其车身样式和物理参数的关系 汽车价格与其车身样式,尺寸和发动机规格的关系 用于分析工作的Python笔记本: 参考: 美国公路安全保险学会| 公路损失数据研究所-
2022-05-26 10:08:54 40.65MB JupyterNotebook
1
深度学习音频超分辨率 这是我的数据科学硕士学位论文项目。 抽象的 音频超分辨率是从低频预测给定信号缺少的高频成分的问题。 最近的一些研究表明,通过将音频超分辨率建模为回归任务,深度学习算法能够取得显着效果。 文献中已经提出了各种各样的方法,包括卷积和递归体系结构以捕获音频帧之间的局部和长期依赖性。 此外,一些研究表明,通过利用傅立叶变换操作作为神经网络配置的组成部分,不仅可以在时间上,而且可以在频域上处理输入信号,可以实现显着的改进。 本项目的目的不仅是要研究这些方法,而且要以有原则的方式将它们结合起来,以探索一种新颖的模型架构。 介绍 本文的重点是在受到一些最新技术启发的情况下,实现一种新颖的模型体系结构。 这项工作中大多数提议的方法都源于以下两项研究: 索耶·比恩鲍姆(Sawyer Birnbaum)等。 “临时电影:用特征明智的调制捕获远程序列依赖性”。 于:神经信息处理系统的进展
2022-05-24 13:33:29 137.31MB JupyterNotebook
1
使用Gudhi库进行拓扑数据分析的教程 拓扑数据分析(TDA)是一个新兴且发展Swift的领域,它提供了一组新的拓扑和几何工具来推断可能复杂数据的相关特征。 在这里,我们使用Python Gudhi库以及流行的机器学习库和数据科学库为TDA的实践提出了一套笔记本。 例如,请参阅了解有关数据科学的TDA的介绍。 笔记本的完整列表也可以在此页的末尾找到。 安装Python Gudhi库 请参阅或者如果您有conda,则可以进行。 TDA分析管道 01-单纯形树和简单组合 TDA通常旨在从网络中的点云中提取拓扑特征。 或在一般指标空间中。 通过研究点云的拓扑,我们实际上意味着研究以点云为中心的球的并集的拓扑,也称为偏移。 但是,非离散集(例如偏移量)以及连续的数学形状(如曲线,曲面和更一般的流形)不能轻易地编码为有限的离散结构。 因此,在计算几何中使用形来近似这样的形状。 单纯形复数是一组,它
2022-05-06 15:25:01 24.43MB JupyterNotebook
1