上传者: 38730821
|
上传时间: 2022-12-19 17:30:02
|
文件大小: 905KB
|
文件类型: PDF
Python requests30行代码爬取知乎一个问题的所有回答
之前学习了Python的requests爬虫一直想找机会自己练习下,正好作为一个大学生平时知乎看的也不少,那就爬取知乎吧,先上源码和效果图(我找的是随便一个热门问题,你讨厌的LOL主播是什么,总共1911个回答)
可以看到记事本里面的东西特别多啊,差不多有超级多的答案
好了,说思路了
本来以为知乎需要模拟登录才能爬取,后来发现不需要
直接在network中找到answer,访问那个url就可以了
知乎上的问题答案肯定不是在页面上直接有的,也就是说检查网页源代码是出不来的,不能直接爬取,应该是一个ajax请求的类型
可以