上传者: 38648800
|
上传时间: 2021-12-28 01:38:49
|
文件大小: 3.65MB
|
文件类型: -
【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云
个人博客地址:ht/tps://www.asyu17.cn/
精彩部分提醒:
(1)微博评论页详情链接为一个js脚本
(2)获取js脚本链接需要该条微博的mid参数
(3)获取mid参数需要访问微博主页
(4)访问微博主页需要先进行访客认证
(5)微博主页几乎是由弹窗构成,所有html代码被隐藏在FM.view()函数的参数中,该参数是json格式
工具:
Python 3.6
requests 库
json 库
lxml 库
urllib 库
jieba 库(进行分词)
WordCloud 库(产生词