【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云
个人博客地址:ht/tps://www.asyu17.cn/
精彩部分提醒:
(1)微博评论页详情链接为一个js脚本
(2)获取js脚本链接需要该条微博的mid参数
(3)获取mid参数需要访问微博主页
(4)访问微博主页需要先进行访客认证
(5)微博主页几乎是由弹窗构成,所有html代码被隐藏在FM.view()函数的参数中,该参数是json格式
工具:
Python 3.6
requests 库
json 库
lxml 库
urllib 库
jieba 库(进行分词)
WordCloud 库(产生词
2021-12-28 01:38:49
3.65MB
学习
数据
爬虫
1