上传者: 38722607
|
上传时间: 2021-05-05 15:43:38
|
文件大小: 162KB
|
文件类型: PDF
解决requests.get()方法返回代码与浏览器Elements选项卡不一致的问题
疫情期间无聊,玩起了Python爬虫,正好舍友让我帮忙下载一个知乎视频。这里附上链接。
美版《黄金单身汉》拟音
网站本身的源码很简单。我们查看一下网页源代码。
可以看到代码很简单,而且可以看到里面的一些js链接,网站可能使用js渲染过的。
接下来开始爬取。
爬取的时候问题来了,用requests.get()方法返回的代码和上述图片的代码一摸一样。体里面没有我们需要的图片链接。
这时候我们打开浏览器的开发者工具(F12),我们查看Elements选项如图:
可以看到体里面有一个块,里面有我们需要的链接。如