上传者: 38657465
|
上传时间: 2021-11-13 18:06:08
|
文件大小: 891KB
|
文件类型: -
前言
莫名其妙博客不给通过,搞了好久避开各种词。谜一样的操作···
前面已经写了两篇,都是用requests爬取页面,之前腾讯提供的接口用的json解析内容,丁香园则是直接用BeautifulSoup。
requests+json爬取腾讯新闻feiyan实时数据并实现持续更新
requests+bs4爬取丁香园feiyan实时数据
但是之前用腾讯的接口,一方面腾讯老是换接口,另一方面提供的接口经常不更新数据。而丁香园的数据吧,老是不大准确(比如有两天阿根廷的数据都错了,但可能刚好只是那几天不准确吧)。
由于出现以上种种问题,我决定还是折腾腾讯新闻实时界面,直接爬取那上面的数据。这篇博客就说一下