本项目包含作业要求和源代码,项目基于Python Scrapy爬虫实现对上市公司股民评论的爬取和公司年报的爬取;基于Python Tushare 爬取上市公司行情图,对爬取的内容进行预处理,包括分词、去停用词、转化词袋模型等。最后可视化结果,可视化清晰明了,可作为公司是否存在会计欺诈手段的检测
2021-11-19 12:03:26 34.88MB Scrapy Python预处理大作业 分词、可视化
Python数据分析与机器学习-聚类实践 Python数据分析与机器学习-聚类实践
2021-11-19 11:31:54 3KB python
1
1、pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图等统计图表。 2、柱状图 适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。 优点: 利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。 缺点: 只适用中小规模的数据集。 柱状图最基本用法 from pyecharts import Bar fruits = ['苹果','香蕉','凤梨','桔子'
2021-11-19 11:12:32 476KB ar art bar
1
前言 做网络爬虫的同学肯定见过各种各样的验证码,比较高级的有滑动、点选等样式,看起来好像挺复杂的,但实际上它们的核心原理还是还是很清晰的,本文章大致说明下这些验证码的原理以及带大家实现一个滑动验证码。 实际上这类验证码的校验是分为两个步骤的: 1.第一步就是前端的校验。一般来说,登录注册页面在点击提交的时候都会伴随着一个表单提交,在表单提交的时候会有 JavaScript 事件的触发。如果加入了验证码,那么在表单提交的时候会多加一个额外的验证,判断这个验证码是否已经成功完成了操作。如果没有的话,那就直接取消表单的提交,然后顺便提示说”您的验证没通过,请重新验证“,诸如此类的话。所以这一步就能防
2021-11-18 16:26:27 138KB python 数据校验 验证码
1
今天小编就为大家分享一篇用Python实现数据的透视表的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-11-17 23:00:53 47KB Python 数据 透视表
1
python 数据挖掘 predicting_the_success_of_a_restaurant
2021-11-17 21:05:19 804KB 数据挖掘
1
(默认解压密码:www.snowfox.wang)Python数据分析班学习视频,偏DBA方向;包含代码、课件、资料、视频; 视频内容一共10课时:python入门,数据与Numpy,数据分析Pandas,数据获取与处理,数据可视化化Matplotlib,使用NLTK进行Python文本分析,Python社交网络分析igraph,Python机器学scikit-learn,Python分布式计算; 来源于培训机构; 收集困难,下载的资料为课程百度链接;请知晓!!
2021-11-17 03:18:31 116B python DBA 数据分析
1
前言 有些人看到这个问题觉得不是问题,是嘛,不就是df.col[]函数嘛,其实忽略了一个重点,那就是我们要省去把csv文件全部读取这个过程,因为如果在面临亿万级别的大规模数据,得到的结果就是boom,boom,boom。 我们要使用一下现成的函数里面的参数nrows,和skiprows,一个代表你要读几行,一个代表你从哪开始读,这就可以了,比如从第3行读取4个 示例代码 import pandas as pd df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]}) df.to_csv('tes
2021-11-16 15:55:13 41KB c csv csv文件
1
#使用requsets库的简单Python爬虫练习 #练习使用xlsxwriter对Excel进行操作 #主要功能,抓取此时的抖音的热度上升榜和热搜榜写入Excel中
2021-11-15 19:42:17 2KB 爬虫 python 数据分析
1
通过python,将数据中的缺失数据情况用图表显示。该资料数据来源于能源领域。通过帮助文档可以快速使用函数。
2021-11-15 05:05:31 591B python 缺失数据
1