携程游记爬取+词云分析
2024-06-26 20:07:08 8.16MB 爬虫 python 词云
1
基于python的词云分析,里边包含实现功能的所有文件
2022-12-27 09:26:51 359KB python
1
bilibili-barrage-analysis bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化 主要依赖库 selenium pandas lxml json requests pyecharts jieba snownlp wordcloud 信息爬取   1.1 爬取bilibili某一个分区(可通过url定义)特定日期下按照视频热度降序排序的视频信息,包含:href、视频时长、名称、BV号、播放量、弹幕数、up主、up主id   1.2 通过BV号获取视频评论Cid,解析xml网页,简单获取各个视频的弹幕内容(注意:条数有限制,xml的弹幕条数不超过1000条)   1.3 通过up主id,获取up主在爬取时的粉丝数,此粉丝数可以精确到个位数   1.4 通过BV好获取视频评论Cid,获取详细的弹幕内容,包括:弹幕出现时间、弹幕模式、字号、
2021-09-20 19:37:22 26.06MB python selenium pandas wordcloud
1
https://blog.csdn.net/skylibiao/article/details/119060357?spm=1001.2014.3001.5502
2021-07-25 09:03:52 247KB 爬虫 B站弹幕 词云 python
Python实战应用代码-爬取电视剧赘婿评论-词云分析
2021-07-20 13:01:39 17.72MB 词云分析 自然语言处理 Python NLP
bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化 **** **主要依赖库** > selenium > pandas > lxml > json > requests > pyecharts > jieba > snownlp > wordcloud **信息爬取**   1.1 爬取bilibili某一个分区(可通过url定义)特定日期下按照视频热度降序排序的视频信息,包含:href、视频时长、名称、BV号、播放量、弹幕数、up主、up主id   1.2 通过BV号获取视频评论Cid,解析xml网页,简单获取各个视频的弹幕内容(注意:条数有限制,xml的弹幕条数不超过1000条)   1.3 通过up主id,获取up主在爬取时的粉丝数,此粉丝数可以精确到个位数   1.4 通过BV好获取视频评论Cid,获取详细的弹幕内容,包括:弹幕出现时间、弹幕模式、字号、弹幕颜色、弹幕池、发送者加密id、弹幕id **数据分析--词云**   2.1 全区弹幕词云分析,可以通过自己编写剔除单字、去除停用词、调整分词模型进行优化   2.2 分频道弹幕词云分析 **数据分析--弹幕条数**   3.1 分析全区弹幕前十视频,使用pyecharts柱状图进行可视化   3.2 分析各频道平均/最高视频弹幕数 **数据分析--指标构建**   构建指标:互动指数:弹幕数 / 播放量 * 100               粉丝响应指数:up主粉丝数 / 播放量   4.1 全区互动指数最高前十视频   4.2 各频道最高/平均互动指数   4.3 全区粉丝响应指数最高前十视频   4.4 各频道最高/平均粉丝响应指数 **数据分析--情感分析**   5.1 分析全区所爬取的所有视频的所有弹幕的情感分布情况,获取总体情感指数印象   5.2 分析各个视频的情感分析,对每一条弹幕进行情感分析,输出弹幕的情感分析指数Excel表   5.3 分析各个频道的情感分析指数分布图
2021-06-22 19:18:59 25.68MB bilibili 词云分析 爬虫 词频分析
这可以用来做词频词云分析素材。分析红楼梦中人物出场频率,前八十回和后四十回的风格有什么差异,是不是曹雪芹一人完成。
2021-06-21 14:56:19 2.52MB 词频词云分析素材
1
主要介绍了基于Python词云分析政府工作报告关键词,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2021-05-09 21:17:58 137KB Python 词云 分析 工作报告
1
个人自主研制爬虫策略,成功绕过阿里云反爬机制,天猫、淘宝都不在话下!外增词云图绘制代码,带你爬虫、带你数据分析、带你飞!
2021-05-05 15:05:52 490KB Python Scrapy 词云 天猫评论区
1
对书籍章节词汇生成词云
2021-02-18 20:08:53 8KB python
1