本工具是一个高效的重复图片清理解决方案,专为摄影师、设计师和需要管理大量图片的用户开发。通过智能算法快速识别重复图片,支持三种清理策略,并生成可视化HTML报告。 核心功能: 1. 多格式支持:兼容JPG/PNG/GIF/WebP等9种常见图片格式 2. 智能比对:采用文件大小+MD5混合指纹技术,准确率高达99.9% 3. 多线程加速:自动根据CPU核心数优化扫描速度 4. 灵活策略:支持保留最早/最新文件或手动选择 5. 可视化报告:自动生成带缩略图的HTML报告,方便预览 技术亮点: • 使用Pathlib实现跨平台路径处理 • 基于文件大小的预筛选大幅提升效率 • 线程池并发计算文件哈希值 • 支持生成带图片预览的清理报告 使用场景: • 清理手机/相机导入的重复照片 • 整理下载的素材库 • 优化网站图片资源 • 释放磁盘空间 使用方法: 1. 运行脚本后输入要扫描的目录路径 2. 选择清理策略(保留最早/最新/手动选择) 3. 查看自动生成的报告确认要删除的文件 4. 执行清理操作 注意事项: • 首次使用建议先选择"manual"模式熟悉流程 • 重要文件建议先备份再操作 • 支持Windows/macOS/Linux系统 适合Python 3.6+环境,无需额外安装依赖库。
2026-01-26 13:32:38 7KB python工具
1
网络爬虫是一种自动化的网络信息收集技术,它能够模拟人类用户的行为,自动访问互联网并搜集所需的数据。Python作为一种广泛应用于数据处理、网络编程的编程语言,其简洁的语法和强大的库支持使得编写网络爬虫变得更加容易。在Python中,有许多库可以帮助开发人员实现网络爬虫,如requests库用于发送网络请求,BeautifulSoup库用于解析HTML文档,以及Scrapy框架用于大规模爬取网站数据。 本压缩包内含的工具“网络爬虫_Python自动化脚本_QQ空间相册批量下载工具”,专为个人学习研究而设计,目的是批量获取QQ空间相册中的照片,并保存到本地计算机。该工具的出现,使得用户可以快速备份自己的照片,或用于进一步的数据分析。通过自动化脚本,用户无需手动一张张下载照片,大大提高了效率。 此外,该工具还支持多线程下载技术,这意味着它可以同时开启多个下载线程,充分利用网络带宽,实现高速下载。多线程技术在处理大量数据时尤其有用,它可以显著缩短数据收集的时间,提升工作效率。 然而,在网络爬虫的发展过程中,网站反爬机制(即网站为了防止爬虫自动抓取数据而设置的技术障碍)成为了一个不可忽视的问题。本工具在设计时考虑到了这一点,并试图提供绕过反爬机制的策略。绕过反爬机制通常涉及到模拟浏览器行为、处理Cookies、使用代理IP、设置合理的请求间隔等技术手段。这些手段在合理合法的前提下使用,可以帮助爬虫更好地完成数据抓取任务,但同时也提醒用户在使用爬虫技术时应遵守相关法律法规,尊重网站版权和数据隐私政策,不要滥用爬虫技术。 压缩包中的“附赠资源.docx”可能包含了使用说明、相关教程或技术支持信息,而“说明文件.txt”则可能提供更具体的使用方法、配置指南或是问题解答。最后的“qzone_picture_download-master”很可能是该爬虫项目的源代码文件,用户可以在了解了工具使用方法和相关法律法规之后,自行编译和运行这些代码,以实现批量下载照片的需求。 这个压缩包提供了一套完整的解决方案,不仅包括了用于下载QQ空间照片的Python脚本,还附带了使用说明和技术文档,使得个人用户可以方便地进行数据备份和分析。但同时,用户也应意识到爬虫技术的道德和法律边界,合理合法地使用这些技术。
2025-11-29 12:38:29 75KB
1
相比较初代 GNU Wget,Wget2 速度更快,支持更多的协议,特别是围绕 HTTP/2 和压缩,支持多线程/并行连接,以及其他改进。 GNU Wget2 2.0 增加了 HTTP2 上传,通过新的 -download-attr 选项支持 HTML5 下载属性,“Accept-Encoding: lzip”支持,各种选项以提高与 GNU Wget 的向后兼容性,在输出中支持终端超链接,以及其他大量的改进和修复。GNU Wget2 2.0 的 OpenSSL 集成改进包括 ALPN 支持、OCSP 支持和 OCSP 装订,修复内存泄漏,以及其他方面的改进。 **下载** https://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz https://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.lz **项目网站** https://gitlab.com/gnuwget/wget2 **在线文档** https://gnuwget.gitlab.io/wget2/reference/
2022-06-14 21:00:35 3.61MB Wget2 Wget
1
最近突然需要将小米相册里的图片导到本地 转移到 icloud+ 一张张下载太麻烦了 写了一个小软件 将云相册里的图片 以原图形式保存到本地 多线程有bug 下载结束后 自动关闭软件 不急着要的话 建议单线程比较稳定 小米的cookie 打开云相册 刷新后 按f12 抓包获取 小米cookie 有时效 有一个接口可以直接获取 等v2.0后发布更新 大家先用着 昨天其实也发布了 但是没注意看保存的是略缩图 谁能想到网页上浏览的大图竟不是原图呢 还得从访问两个接口 才能获得原图下载地址 = = 不过问题不大 我还是找到了 获取原图下载办法 所以让版主帮忙删了帖子 未来计划添加: 按日期分类文件夹 或者 按日期下载 图片 略缩图 cookie 长时间保持
2022-05-23 11:00:56 1.48MB 源码软件 综合资源
跨平台支持Windows,Linux和Mac...只要有装JAVA的系统都能用。比SuperPI等拷机软件好用,支持最多16线程,完美支持6核甚至未来的8核系统稳定性测试。
2022-05-11 20:01:55 20KB 多线程 JAVA CPU 窗体
1
这是一个套接字模块 使用内置iocp实现异步操作 使用了线程安全的队列操作回调,保证了对应域下的回调操作不需要加锁 v1.1 修改 run的实现方式 提升效率 修改 socket_create 创建UDP套接字时,增加默认SIO_UDP_CONNRESET = 0 修复 strand_post 一处bug(这个bug有几率导致崩溃)
2022-05-04 16:53:35 88KB 易语言模块源码
1
将相同的table 提取出来,实测减了20mlua内存
2022-04-06 01:13:28 3KB unity lua 游戏引擎 开发语言
1
一个C#的日志类,支持多线程调用 经过10000线程并发测试未发现问题
2022-03-29 11:46:39 5KB C# 日志类 多线程调用
1
用@酷宝贝 的sqlite3数ju库模块1年多了,稳定的雅痞。 感谢酷宝贝提供的帮助和例程:原贴 -> 点我传送 今天特意来分享一下我自己写的内存数ju库操作例程 同时附带自己封装的增删查改函数,不一定对大家都有用 大家可以看此例程取其精华去其糟粕 用到了两个模块,大家可以替换成自己的 1.zySQLite3.ec 2.精易模块[v9.0.5].ec
2022-01-28 14:04:53 764KB 易语言sqlite3内存数据库+
调用了精易模块和E2EE支持库的WebSocket客户Duan