爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法。python提供了强大的url库,想做到这个并不难。这里以登录学校教务系统为例,做一个简单的例子。 首先得明白cookie的作用,cookie是某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据。因此我们需要用Cookielib模块来保持网站的cookie。 这个是要登陆的地址 http://202.115.80.153/ 和验证码地址 http://202.115.80.153/CheckCode.aspx 可以发现这个验证码是动态更新的每次打开都不一样,一般这种验证码和cookie是同步的。其次
2021-11-20 00:51:36 184KB cookie python python爬虫
1
主要介绍了python爬虫 模拟登录人人网过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2021-05-05 15:39:32 41KB python 爬虫 模拟登录
1
主要介绍了Python爬虫模拟登录带验证码网站的相关资料,需要的朋友可以参考下
1