这段代码主要用于从网站 “https://yesmzt.com” 上抓取并下载图片。它使用了以下技术: 请求库(Requests):用于发送 HTTP 请求到网站并获取响应。 XPath 和 lxml 库:用于解析 HTML 文档并提取所需的数据。 AES 加密和解密:用于处理网站上的加密数据。这部分代码使用了 Crypto.Cipher 库中的 AES 模块和 Crypto.Util.Padding 库中的 unpad 函数。 哈希函数(Hashing):用于生成特定的密钥,这部分代码使用了 hashlib 库中的 md5 函数。 Base64 编码和解码:用于处理二进制数据,这部分代码使用了 base64 库。 代码的主要流程如下: 首先,它会获取特定页面上的所有图片 ID(get_id_list 函数)。 然后,对于每个 ID,它会发送一个请求到服务器以获取加密的图片 URL 数据(get_img_url_list 函数)。 这些加密数据会被解密(decrypt 函数),得到实际的图片 URL 列表。 最后,代码会下载每个 URL 对应的图片并保存到本地
2024-08-20 16:03:53 4KB javascript python爬虫 aes
1
Chrome插件-XPath Helper 完成Bing每日壁纸的小爬虫.zip。XPath是一个辅助我们写爬虫的小插件, 我们可以用XPath辅助我们完成一个Bing壁纸的小爬虫
2023-12-01 21:22:11 245KB Chrome插件-XPath
1
1.强大的查询能力,支持xpath(2种模式) 2.批量修改tag 3.轻松添加或插入新节点等 4.删除功能 等等...(具体查阅javadoc,测试的junit文件和xml文件) 该xml工具开源,没有任何license,经过严格junit测试,可以用在日常开发中。 support me!
2023-02-20 17:35:49 75KB java xml utility xpath
1
主要介绍了python实例:xpath爬虫实例,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
2023-02-11 00:17:44 276KB python实例 python xpath爬虫
1
爬虫技术
2023-01-04 19:19:00 2.6MB 爬虫技术
爬虫技术
2023-01-02 19:18:09 1.49MB 爬虫技术
仅用作学习交流用。jd_book爬虫,用scrapy框架,爬取https://book.jd.com/booksort.html大分类全部的书数据。爬取了分类名,分类链接地址,分类下的图书名,图片,作者,出版社,出版时间,SKU(获取JSON用的,包括价格),价格。
2022-12-27 15:12:51 107KB jd_book爬虫 scrapy xpath
1
XMLQuire XML/xpath 辅助分析工具,支持win10x64
2022-11-28 08:10:31 1.11MB xml xpath
1
python语言中获取网页信息工具xpath
2022-10-19 19:05:24 445KB python
1