Spotify笔记本 这是Spotify的主要内容的Python部分,主要探讨python的数据分析技术和表示样式。 这是创建仪表盘的基础。 归纳法 这是通过名为Spotify.ipynb的文件中的python和jupyter notbook完成的数据可视化和分析 了解类别 内容 “ data.csv”文件包含从Spotify Web API收集的170,000首歌曲,您还可以在其他数据集中找到按艺术家,年份或流派分组的数据。 该数据集由Kaggle用户YamaçEren Ay上传,您可以在这里找到原始数据集 主: id(Spotify生成的轨道的ID) 数值: 声音(范围从0到1) 舞蹈性(范围从0到1) 能量(范围从0到1) duration_ms(整数通常为200k至300​​k) 工具性(范围从0到1) 价(范围从0到1) 受欢迎程度(范围从0到100) 速度(
2021-11-07 00:58:48 17.01MB python seaborn data-analysis matplotlib
1
ALIBABA-Cloud_Baby-Goods-Info-Data-Analysis 数据来源: ://tianchi.aliyun.com/dataset/dataDetail?dataId=45数据描述了TAOBAO和TMALL平台2012-2015年婴儿用品的销售。 这两个表(示例)sam_tianchi_mum_baby_trade_history.csv和(示例)sam_tianchi_mum_baby.csv提供有关交易历史的信息以及部分客户信息。 该项目旨在通过分析3个维度的数据来增加销售量:时间,产品类别和用户画像。 大多数可视化部分都使用中文。在文件天池数据集-母婴用品销售情况分析.sql中,提供了一些用于数据处理MySQL代码。 报告“天池数据集电商母婴用品销售数据分析.pdf”中的结果基于Power BI的可视化以及Excel和MySQL的数据清理与处理。
2021-11-06 13:25:20 1.48MB
1
Title: Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd Edition Author: Wes McKinney Length: 550 pages Edition: 2 Language: English Publisher: O'Reilly Media Publication D ate: 2017-09-25 ISBN-10: 1491957662 ISBN-13: 9781491957660 Table of Contents Chapter 1 Preliminaries Chapter 2 Python Language Basics, IPython, and Jupyter Notebooks Chapter 3 Built-in Data Structures, Functions, and Files Chapter 4 NumPy Basics: Arrays and Vectorized Computation Chapter 5 Getting Started with pandas Chapter 6 Data Loading, Storage, and File Formats Chapter 7 Data Cleaning and Preparation Chapter 8 Data Wrangling: Join, Combine, and Reshape Chapter 9 Plotting and Visualization Chapter 10 Data Aggregation and Group Operations Chapter 11 Interlude: Data Analysis Examples Chapter 12 Time Series Chapter 13 Advanced NumPy Chapter 14 Using Modeling Libraries with pandas Chapter 15 Examples Data Sets Appendix Advanced IPython and Jupyter
2021-11-05 21:16:39 9.4MB Python for Data Analysis
1
Image processing and data analysis
2021-11-05 15:27:13 7.1MB Image Data Analysis
1
使用机器学习预测足球比赛结果:在Jupyter Notebook中使用机器学习算法进行足球比赛预测
1
《深入浅出数据分析》/Head First Data Analysis随书数据代码
2021-11-02 00:56:23 116KB 随书代码
1
熊猫 介绍 pandastable库为Tkinter提供了具有绘图和数据处理功能的表小部件。 它使用pandas DataFrame类存储表数据。 Pandas是一个开源Python库,提供高性能的数据结构和数据分析工具。 Tkinter是python的标准GUI工具包。 它旨在用于以下用途: 适用于希望在其应用程序中包含可以存储和处理大量数据的表的python / tkinter GUI开发人员 适用于不熟悉Python或pandas API并希望使用随附的DataExplore应用程序来操纵/查看其数据的非程序员 这对于希望对表格数据进行初始交互查看而无需编码的数据分析人员和程序员可能也很有用。 使用这些类的DataExplore应用程序包含在分发中,并且是用于教育和研究用途的独立应用程序。 当前,这侧重于提供类似于电子表格的界面以用于可配置2D / 3D绘图的表格操作。 Win
2021-10-28 19:12:44 4.7MB pandas tkinter data-analysis scientific
1
Python 代码,最好还是自己敲代码
2021-10-26 23:01:18 172KB Python
1
Dive deeper into data analysis with the flexibility of Python and learn how its extensive range of scientific and mathematical libraries can be used to solve some of the toughest challenges in data analysis. Build your confidence and expertise and develop valuable skills in high demand in a world driven by Big Data with this expert data analysis book. This data science tutorial will help you learn how to effectively retrieve, clean, manipulate, and visualize data and establish a successful data analysis workflow. Apply the impressive functionality of Python's data mining tools and scientific and numerical libraries to a range of the most important tasks within data analysis and data science, and develop strategies and ideas to take control your own data analysis projects. Get to grips with statistical analysis using NumPy and SciPy, visualize data with Matplotlib, and uncover sophisticated insights through predictive analytics and machine learning with SciKit-Learn. You will also learn how to use the tools needed to work with databases and find out how Python can be used to analyze textual and social media data, as you work through this essential data science tutorial.
2021-10-26 22:58:42 24.13MB Python Data Analysis NumPy
1
飞行数据分析 我们的数据集包含有关2013年从纽约出发的所有航班的信息,总共包含约336,776个航班。 软件和库: Jupyter笔记本 Python 3.x 脾气暴躁的 大熊猫 MatplotLib 海生 熊猫分析 该数据集由以下变量组成: 年:2013 月:1-12 日期:每月的某天(1-31) dep_time:出发时间,当地时区 sched_dep_time:预定出发时间 dep_delay:出发延迟时间(以分钟为单位),负数表示提早出发 arr_time:到达时间,本地时区 sched_arr_time:预定到达时间 arr_delay:到达延迟(以分钟为单位),负数表示提前到达 载体:两个字母的缩写 航班:航班号 tailnum:平面尾号 原点:原点的机场代码 dest:目的地的机场代码 air_time:在空中停留的时间,以分钟为单位 距离:飞行距离,以英里
2021-10-25 19:35:34 486KB JupyterNotebook
1