上传者: 38707192
|
上传时间: 2021-02-18 10:06:24
|
文件大小: 218KB
|
文件类型: -
Python练习项目目标编写Python微博爬虫数据来源微博列表请求分析应答报文分析获取微博正文微博正文文本提取获取多页微博反爬虫机制应对处理爬虫完整代码词云图生成成果展示
目标
用爬虫程序抓取目标用户人民日报的微博文本,通过分析词频,生成直观的词云图。
编写Python微博爬虫
注意:微博的接口可能会发生变化,所以请不要盲目照抄,建议按照下述流程独立分析。
数据来源
微博移动版网页(点此跳转)
内容简洁,便于分析,因此选用移动版网页作为爬取对象。
微博列表请求分析
打开目标用户的移动版微博主页:人民日报
注意:此处需要退出微博登录来保证请求内容的普适性。
F12打开开发者工具,这里使用的是谷