为什么ip会被封?
当我们爬取一些网站时,会发现ip被封了。这是因为网站为了防止被爬取,会有反爬机制,对于同一个ip地址的大量同类型的访问,会封锁ip,过一段时间后才能继续访问
如何解决ip被封的问题?
有几种方法:
1.修改请求头,模拟浏览器(不是代码去直接访问)访问
2.使用代理ip并轮换
3.设置访问时间间隔
如何获取代理ip地址
从该网站获取:https://www.xicidaili.com/
inspect->鼠标定位
要获取的代理ip地址,属于class=’odd’标签的内容:
#将获取的代理ip保存到proxy_ip_list列表中
#导入相关库
from bs4 impor
1