开发环境: Pym(python3.8),使用库:requests、selenium、multiprocessing、json 使用说明: 共做了两个方案: (1)直接分析解码百度图片AJAX请求,直接爬取后台图片。这种方法虽然简单,但很容易被百度反爬虫发现,不太稳定。 (2)通过Selenium模拟浏览器操作来避免百度反爬,这种方法比较稳定。此外,通过多过程提高了效率。
2021-08-16 13:08:12 5.12MB 开发环境:Pym(python