山东大学软件学院2022-2023数据科学导论知识点整理【软工大数据课组】
2023-12-22 23:18:13 3.91MB 山东大学软件学院
1
探索美国自行车共享:探索美国自行车共享-数据科学纳米度编程-Udacity-Python(Numpy和Pandas)
2023-07-27 15:40:44 24.42MB Python
1
数据重塑Learn Python for Data Science Interactively高级索引重置索引前向填充后向填充Country Capital P
2023-07-26 15:49:09 439KB c# python pandas
1
随着大数据时代的到来,数据分析和机器学习已经成为许多领域不可或缺的一部分。而在这些领域中,数据集是进行训练和测试的重要资源。为了方便数据分析和机器学习项目的开发,已经有许多公开的数据集资源可以供大家免费使用。 在这些公开的数据集资源中,Kaggle、UCI机器学习存储库、Google 数据集搜索、AWS 公开数据集、数据集之家、数据堂、数据派等资源提供了大量涵盖不同领域和不同规模的数据集,涉及到的领域包括但不限于自然语言处理、计算机视觉、社交网络分析、金融、医疗等。 这些数据集的使用可以帮助数据科学家和机器学习从业者更好地进行训练和测试,提高模型的准确性和鲁棒性。同时,这些数据集也可以为初学者提供一些实践的机会,帮助他们掌握数据分析和机器学习的相关技能。 因此,数据科学领域资源汇总:数据集搜索平台+机器学习+公开数据集+为数据分析和机器学习项目提供免费数据资源的主题非常适合用于数据科学和机器学习的毕业设计,让学生们有机会深入研究和使用这些公开数据集资源,探索数据分析和机器学习的更多可能性。
2023-06-15 18:08:59 2KB 数据集 机器学习 数据分析
1
Cookiecutter EasyData 面向数据科学家,团队和研讨会组织者的python框架和git模板,旨在使您的数据科学具有可重现性 对于我们大多数人来说,数据科学是5%的科学,60%的数据清理和35%的IT地狱。 Easydata通过帮助您实现95%的目标 可复制的python环境, 可复制的数据集,以及 可重复的工作流程 换句话说,Easydata是一个模板,库和工作流,可让您快速而可重复地启动并运行数据科学分析。 什么是Easydata? Easydata是用于构建自定义数据科学git repos的python cookiecutter,它提供: 专心合作,讲故事的工作流程, 一个支持此工作流程的python框架 用于conda和pip环境管理的Makefile包装器 预先建立的数据集配方,以及 有关进行可重复数据科学的大量培训材料和文档资料库。 Easydata
2023-04-14 10:49:05 188KB Python
1
数据科学教程:有关如何使用Python,Pandas,Seaborn,Numpy,Matplotlib,Scipy进行数据科学的教程
2023-03-17 22:56:12 11.52MB
1
第五章 探索性数据分析,结合了dplyr和ggplot2 1.简介 提出问题→通过可视化,转换和建模来解决问题→优化并提出新问题 2.提出问题 变量自身会发生何种变动? 变量之间会发生何种相关变动? 术语:在tidydata(整洁的数据)中,行是观测,列是变量。 变量:一种可测量的数量、质量或属性。 值:变量在测量时的状态。变量值在每次测量之间可以发生改变。 观测:或称个案,指在相同条件下进行的一组测量(通常,一个观测中的所有测量是在同一时间对同一对象进行的)。一个观测会包含多个值,每个值关联到不同的变量。有时我们会将观测称为数据点。 表格数据:一组值的集合,其中每个值都关联一个变量和一个观测
2023-03-03 09:30:57 77KB aes diamonds 变量
1
Python Data Science Handbook[美]Jake VanderPlas【高清版】,PDF
2023-01-22 21:53:45 18.44MB python 数据分析 数据科学 数据处理
1
这是 ShowMeAI 持续分享的速查表系列!本速查表是《数据科学家学习路线图》,作者与硅谷多家顶级科技公司的高级数据科学家、数据科学经理们进行了交谈,并从这些对话中总结了经验,绘制了这张路线图。每个有兴趣进入数据科学领域的人,可以根据这张路线图有目标和重点地进行学习。
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:作者 Sanjiv Ranjan Das 是 Santa Clara 大学商学院金融与数据科学教授。这本书是作者为其课程《Machine Learning with R》开发整理的课堂笔记。 ◉ 目录: 数据科学的艺术 起步:数学基础 开源:R语言建模 更多:数据处理与其他 方差均值:马科维茨优化 从经验中学习:贝叶斯定理 自然语言:从新闻中提取信息 巴斯模型 提取维度:判别和因子分析 竞标:拍卖 截断和估计:有限的因变量 乘风破浪:傅里叶分析 建立联系:网络理论 统计大脑:神经网络 聚类分析和预测树
2022-12-31 12:25:25 4.29MB 人工智能 数据科学 算法 R语言
1