本项目包含作业要求和源代码,项目基于Python Scrapy爬虫实现对上市公司股民评论的爬取和公司年报的爬取;基于Python Tushare 爬取上市公司行情图,对爬取的内容进行预处理,包括分词、去停用词、转化词袋模型等。最后可视化结果,可视化清晰明了,可作为公司是否存在会计欺诈手段的检测
2021-11-19 12:03:26 34.88MB Scrapy Python预处理大作业 分词、可视化