Python数据分析三部曲【Pandas篇】.pdf
2022-10-27 14:04:18 4.76MB Python 数据分析 Pandas
1
前言 我们从网上爬取数据,最后一步会考虑如何存储数据。如果数据量不大,往往不会选择存储到数据库,而是选择存储到文件中,例如文本文件、CSV 文件、xls 文件等。因为文件具备携带方便、查阅直观。 Python 作为胶水语言,搞定这些当然不在话下。但在写数据过程中,经常因数据源中带有中文汉字而报错。最让人头皮发麻的编码问题。 我先说下编码相关的知识。编码方式有很多种:UTF-8, GBK, ASCII 等。 ASCII 码是美国在上个世纪 60 年代制定的一套字符编码。主要是规范英语字符和二进制位之间的关系。英语词汇组成简单,由 26 个字母构成。使用一个字节就能表示一个字母符号。外加各种符号,
2022-10-25 13:20:24 68KB csv python 数据
1
python数据分析基础day01
2022-10-23 09:03:52 127KB Python 黑马
1
【计算机课程设计】python 数据爬取统计局,使用前请务必查看说明文档,此内容适合新手小白和在校学生
2022-10-16 18:30:16 5.83MB
1
Python 数据科学速查表 14 张(呆鸟译)
2022-10-16 11:40:29 4MB  数据科学 Python 速查表
1
Python数据处理与分析-葡萄酒评论分析课设数据和代码
2022-10-15 22:19:50 3.83MB python
FashionMNIST这是一个单通道的十分类图片数据集,初学机器学习时的常用数据集,包括了六万张图片的训练集和一万张图片的测试集
2022-10-14 11:22:31 58.18MB python 数据集 图片分类 cnn
1
用于文章《Python量化投资——投资结果的评价,阿尔法alpha、贝塔beta、夏普率sharp、波动率volatility的计算和可视化》的实例讲解。 一个CSV文件,包含一个量化轮动交易策略在过去十年里模拟交易结果,其格式为一张数据表,包含每一个交易日结束时当天持有的两种资产(沪深300指数或创业板指数)的数量,持有的现金数量,持有资产和现金的总价、以及作为比较基准的沪深300指数的当天收盘价。 下载本文件并参考上述文章,可以了解如何对交易的结果进行全面的评价,并最终生成一张专业的投资结果评价可视化图表。
2022-10-06 17:29:31 174KB 量化投资 python 数据处理 数据可视化
1
01 前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据。然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了解如何从pdf文件中提取数据,并将数据转换为诸如“csv”之类的格式,以便用于分析或构建模型。 在本文中,我们将重点讨论如何从pdf文件中提取数据表。类似的分析可以用于从pdf文件中提取其他类型的数据,如文本或图像。我们将说明如何从pdf文件中提取数据表,然后将其转换为适合于进一步分析和构建模型的格式。我们将给出一个实例。 02 示例:使用Python从PDF文件中提取一个表格 a)将表复
2022-10-04 16:50:00 226KB python 数据 示例
1
数据表+源码+报告 大三数据挖掘实验
2022-09-30 14:32:16 235KB 数据挖掘 关联规则
1