之前写过一篇爬取小说的博客,但是单线程爬取速度太慢了,之前爬取一部小说花了700多秒,1秒两章的速度有点让人难以接受。 所以弄了个多线程的爬虫。 这次的思路和之前的不一样,之前是一章一章的爬,每爬一章就写入一章的内容。这次我新增加了一个字典用于存放每章爬取完的内容,最后当每个线程都爬取完之后,再将所有信息写入到文件中。 之所以用字典是因为爬完之后需要排序,字典的排序比较方便 为了便于比较,这次选择的还是之前博客里面相同的小说,不清楚的可以看看那篇博客: python爬虫实例之小说爬取器 下面就上新鲜出炉代码: import threading import time from bs4 impo
2021-10-04 22:59:43 63KB html代码 python python函数
1
小说的一个智能爬取,包括表格库,lxml库的合理运用 多线程的运用。 压缩包中还有各种拆分后的详细demo 可以帮助你们更好理解
2021-09-16 15:36:30 52.64MB python 爬虫 多线程 lxml
1
Python爬取小说
2021-08-03 09:29:40 4KB python 小说 爬虫 源码
爬取下载某网站全本下载, 代码挺少的,最适合初学习python爬虫的同学使用
2021-06-03 22:04:58 975B python 爬虫
1
用scrapy框架爬虫爬取小说导入数据库并用django框架搭建自己的小说网站
2021-03-21 09:09:34 16.02MB Python开发-Web爬虫
1
爬虫脚本项目源码-爬取小说
2021-02-27 11:02:51 1.64MB 小说 爬虫脚本项目源码 Python
爬虫 爬取小说
2021-01-28 04:58:30 863B 爬虫
学习python过程中写的一个小说爬虫程序,仅供学习交流
2020-01-09 03:09:06 10KB 爬虫
1
这是一个Java的爬虫项目,自己是用来爬去网站上的小说内容的。
2019-12-22 03:14:20 102KB Java爬虫 爬虫入门 爬虫dem 爬取小说
1