爬取豆瓣网图书TOP250的信息,只有一级网页结构,可以帮助初学时入门。
2021-12-25 20:26:18 116B Scrapy 豆瓣图书信息
1
在豆瓣图书热门标签浏览页面下,采集了全部书籍的部分信息,包括了书籍的名称、评分、豆瓣成员常用的标签以及该书籍的URL地址,共54946多条。
2020-11-05 09:55:44 14.36MB 豆瓣 图书 标签 评分
1
爬取指定标签List下评分8.5分以上的图书信息,包括书名、作者、评分、简介,并保存到excel,以标签分类,放到不同的sheet中。核心代码: title= book.find_element_by_xpath('.//a[1]').text #获取书名 zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0] jianjie= book.find_element_by_xpath('.//p[1]').text #获取简介 worksheet.write(i,0,fenshu); #分数写入第i行的第一列 worksheet.write(i,1,title); #书名写入第i行的第二列 worksheet.write(i,2,zuozhe); #作者写入第i行的第三列 worksheet.write(i,3,jianjie); #简介写入第i行的第四列
2020-01-03 11:36:35 3KB 豆瓣爬虫 Python selenium
1