上传者: 38715048
|
上传时间: 2021-09-07 18:47:58
|
文件大小: 46KB
|
文件类型: PDF
使用Xpath语法爬取豆瓣读书Top250(csv存取数据)
使用的软件是Spyder
网页地址:https://book.douban.com/top250?start=0
直接上代码:
建议大家从网站上爬取数据的时候采取采取以下方法:
import time
time.sleep(0.2)
以减缓对服务器的压力,当然如果爬取的数据量不大的话可以不采用,防止被封IP。
以下是完整代码:
# -*- coding: utf-8 -*-
"""
Created on Thu Apr 30 18:35:17 2020
@author: ASUS
"""
import requests
impor