这段代码主要用于从网站 “https://yesmzt.com” 上抓取并下载图片。它使用了以下技术:
请求库(Requests):用于发送 HTTP 请求到网站并获取响应。
XPath 和 lxml 库:用于解析 HTML 文档并提取所需的数据。
AES 加密和解密:用于处理网站上的加密数据。这部分代码使用了 Crypto.Cipher 库中的 AES 模块和 Crypto.Util.Padding 库中的 unpad 函数。
哈希函数(Hashing):用于生成特定的密钥,这部分代码使用了 hashlib 库中的 md5 函数。
Base64 编码和解码:用于处理二进制数据,这部分代码使用了 base64 库。
代码的主要流程如下:
首先,它会获取特定页面上的所有图片 ID(get_id_list 函数)。
然后,对于每个 ID,它会发送一个请求到服务器以获取加密的图片 URL 数据(get_img_url_list 函数)。
这些加密数据会被解密(decrypt 函数),得到实际的图片 URL 列表。
最后,代码会下载每个 URL 对应的图片并保存到本地
1